Axtarış Algoritmləri ilə Bağlı

Salam. Deməli, mənim əlimdə milyona yaxın 500-600 söz olan mətnlər var və mən bu mətnlərdə axtarış edən proqram yazmaqdayam. Amma bu mətnlərdə, yəni cədvəlin sətirlərində (table rowlarında) axtarış edərkən çox uzun çəkir(Levenstein metodu ilə mətndə yaxın sözü axtarıram). 60 sətir bir saniyə təqribən (O(n)). Həll üçün fikirlərini eşitmək istəyərdim. (Indexləmə haqqında məlumat yığıram hazırda.)


Yadda saxlama
Kateqoriya: Web skriptlər, kod həlləri . , , , , , , . Qısa keçid.

Verilmiş cavablar və yazılan şərhlər (2 cavab var)

(01:39, 21/01/2012 ) #7164

Salam.
Axtarış nəhəngləri yəqin qat-qat optimal yollardan istifadə edirlər, amma inanmıram ki, bu adi siz deyən funksiyanın sürətindən eksponensial fərqlənən metodlara malikdirlər, yox məncə üstünlük polinomialdır. Onlara üstünüyü verən super serverlərdir. 1000 dəfələrlə daha üstün parametrlərə malik serverlə bizim localhostumuzun işlədiyi kompüterimiz təbii ki eyni sürətlə işləyə bilməz 🙂
Sizin situasiyada əlavə psevdohəllər təklif edərdim.
Keywordlər-dən istifadə etmək.
Oxşar sözlərin ayrıca table-ni qurmaq(İD,Incorrect,Correct). Məsələn user Cvablar sözünü axtarırsa bu yoxlasın ki həmin table-da Cvabların correct variantı varmı, varsa elə korrektin özünü axtarsın böyük table-ın özündə, yoxdursa o halda yeni cütlüyü əlavə etsin bu table-a və sonra oxşarlıq metodu ilə axtarsın çətin də olsa, amma əvəzində bu səhv variantı ikinci dəfə axtaranda artıq çox çevik nəticə verəcək, çünki table-da artıq bu cütlük var. Düşünərəm, başqa təkliflərim olsa yazaram 🙂

Cavablamaq üçün sağ sütundan hesaba daxil olmaq lazımdır

(16:05, 25/01/2012 ) #7394

Siz deyən yoldan getdim. Amma səhv sözləri tək-tək clusterə əlavə etmək xeyli vaxt alacaq deyə bir az metamorfoza məruz qaldı. Təsəvvür etsək ki, bu yeni mətnlər əlavə etdikcə dəyişəcək, clusterlər da dəyişilməli olur. Başqa metodla etdim, hələ ki, bir problem çıxartmayıb: mətndəki sözləri distinct olaraq all_words deyə bir table-a atıram və axtarışa verilən sözə ən yaxın sözləri levenstein methodu ilə tapıram. nə qədər yaxın olduğuna görə ranking də edə bilirəm. (nolsun localhostdayıq 🙂 1-2 saniyə arası vaxt alır 8000 söz var bazada hələki ) trie strukturunu istifadəsini məsləhət gördülər. Əgər indiki halında bir nasazlıq yaransa, trie haqqında fikirləşəcəm.

Cavablamaq üçün sağ sütundan hesaba daxil olmaq lazımdır

Bu suala aid öz sualım var:
Sual verin
Bu suala cavab vermək istəyirəm:
Cavab verin

Cavab verin


Cavab yazmaq üçün lütfən sağ sütundan və ya buradan hesaba daxil olun.

Üzvlər üçün giriş

Qeydiyyat

Elan qutusu

Son cavablar və şərhlər

Software Developer cavab verdi - Qırılmış nömrə nə vaxt tam bağlanır (2 saat əvvəl)

Emil Imanov cavab verdi - Rus dilindən mətni tərcümə etmək (5 saat əvvəl)

Software Developer cavab verdi - Payoneer kartdan pul çıxartdıqda vergi (2 gün əvvəl)

Software Developer cavab verdi - Wise vasitəsilə bank kartına pul köçürmə (6 gün əvvəl)

Software Developer cavab verdi - Rus dilindən mətni tərcümə etmək (6 gün əvvəl)

Cənab cavab verdi - Almanca söz bazası yığmaq (9 gün əvvəl)

rdrobert cavab verdi - Mikrofon süngərinə yazı (10 gün əvvəl)

rdrobert cavab verdi - Yerli virtual olaraq dost tapmaq platforması (10 gün əvvəl)

rdrobert cavab verdi - Almanca söz bazası yığmaq (10 gün əvvəl)

rdrobert cavab verdi - Playstation 4 almaq, Playsation klub açmaq (10 gün əvvəl)

rdrobert cavab verdi - Proqramistin ixtsasi hansidir? (10 gün əvvəl)

Software Developer cavab verdi - Azercell Kabinetim aplikasiyasında İstəSən tarifi haqqında (12 gün əvvəl)

Software Developer cavab verdi - Proqramistin ixtsasi hansidir? (12 gün əvvəl)

byshako cavab verdi - Google Azərbaycan nömrələrini qəbul etmir (22 gün əvvəl)

rdrobert cavab verdi - Honeygain, passiv gelir (23 gün əvvəl)

Software Developer - 615 xal

E. Hacı - 607 xal

Onar Alili - 526 xal

Dilsuz - 448 xal

Cabbarov Sübhan - 434 xal

Maqa - 346 xal

Ruslan Butdayev - 328 xal

Namiq Bəndəli - 297 xal

U.Tarlan - 244 xal

Meherremoff - 234 xal

Sistemə daxil olmuş 23237 sualdan 92%-dən çoxu cavablandırılmışdır.

Proyekt haqqında

E-Haci.net istehsalı. © 2010-2024