Mövzu üzrə bənzər suallara da baxa bilərsiniz.

Axtarış Algoritmləri ilə Bağlı

Salam. Deməli, mənim əlimdə milyona yaxın 500-600 söz olan mətnlər var və mən bu mətnlərdə axtarış edən proqram yazmaqdayam. Amma bu mətnlərdə, yəni cədvəlin sətirlərində (table rowlarında) axtarış edərkən çox uzun çəkir(Levenstein metodu ilə mətndə yaxın sözü axtarıram). 60 sətir bir saniyə təqribən (O(n)). Həll üçün fikirlərini eşitmək istəyərdim. (Indexləmə haqqında məlumat yığıram hazırda.)


Kateqoriya: Web skriptlər, kod həlləri . , , , , , , . Qısa keçid.

Verilmiş cavablar və yazılan şərhlər (2 cavab var)

(01:39, 21/01/2012 ) #7164

Salam.
Axtarış nəhəngləri yəqin qat-qat optimal yollardan istifadə edirlər, amma inanmıram ki, bu adi siz deyən funksiyanın sürətindən eksponensial fərqlənən metodlara malikdirlər, yox məncə üstünlük polinomialdır. Onlara üstünüyü verən super serverlərdir. 1000 dəfələrlə daha üstün parametrlərə malik serverlə bizim localhostumuzun işlədiyi kompüterimiz təbii ki eyni sürətlə işləyə bilməz 🙂
Sizin situasiyada əlavə psevdohəllər təklif edərdim.
Keywordlər-dən istifadə etmək.
Oxşar sözlərin ayrıca table-ni qurmaq(İD,Incorrect,Correct). Məsələn user Cvablar sözünü axtarırsa bu yoxlasın ki həmin table-da Cvabların correct variantı varmı, varsa elə korrektin özünü axtarsın böyük table-ın özündə, yoxdursa o halda yeni cütlüyü əlavə etsin bu table-a və sonra oxşarlıq metodu ilə axtarsın çətin də olsa, amma əvəzində bu səhv variantı ikinci dəfə axtaranda artıq çox çevik nəticə verəcək, çünki table-da artıq bu cütlük var. Düşünərəm, başqa təkliflərim olsa yazaram 🙂

Cavablamaq üçün sağ sütundan hesaba daxil olmaq lazımdır

(16:05, 25/01/2012 ) #7394

Siz deyən yoldan getdim. Amma səhv sözləri tək-tək clusterə əlavə etmək xeyli vaxt alacaq deyə bir az metamorfoza məruz qaldı. Təsəvvür etsək ki, bu yeni mətnlər əlavə etdikcə dəyişəcək, clusterlər da dəyişilməli olur. Başqa metodla etdim, hələ ki, bir problem çıxartmayıb: mətndəki sözləri distinct olaraq all_words deyə bir table-a atıram və axtarışa verilən sözə ən yaxın sözləri levenstein methodu ilə tapıram. nə qədər yaxın olduğuna görə ranking də edə bilirəm. (nolsun localhostdayıq 🙂 1-2 saniyə arası vaxt alır 8000 söz var bazada hələki ) trie strukturunu istifadəsini məsləhət gördülər. Əgər indiki halında bir nasazlıq yaransa, trie haqqında fikirləşəcəm.

Cavablamaq üçün sağ sütundan hesaba daxil olmaq lazımdır

Bu suala aid öz sualım var:
Sual verin
Bu suala cavab vermək istəyirəm:
Cavab verin

Cavab verin


Cavab yazmaq üçün lütfən sağ sütundan və ya buradan hesaba daxil olun.

Üzvlər üçün giriş

Qeydiyyat

Elan qutusu

Son cavablar və şərhlər

interist cavab verdi - Aliexpressden sifarişim gecikir (1 gün əvvəl)

loa sian cavab verdi - Paypal + Access Bank (1 gün əvvəl)

E. Hacı cavab verdi - Paypal + Access Bank (1 gün əvvəl)

selef cavab verdi - kompyuter öz-özünə 24 saatdan bir acılır. (1 gün əvvəl)

Texnotexno cavab verdi - Mausun sol duymesi ve windows word 2010 (1 gün əvvəl)

selef cavab verdi - Cavannar tarifinin ləğv olunması (1 gün əvvəl)

Texnotexno cavab verdi - Internet bağlantısı (1 gün əvvəl)

Texnotexno cavab verdi - Cavannar tarifinin ləğv olunması (1 gün əvvəl)

loa sian cavab verdi - Paypal + Access Bank (1 gün əvvəl)

E. Hacı cavab verdi - Paypal + Access Bank (1 gün əvvəl)

loa sian cavab verdi - Paypal + Access Bank (1 gün əvvəl)

selef cavab verdi - Teze sexsiyyet vesiqe (1 gün əvvəl)

selef cavab verdi - Sazz interneti məsləhətdimi? (1 gün əvvəl)

az-hosting cavab verdi - Paypal + Access Bank (1 gün əvvəl)

loa sian cavab verdi - Paypal + Access Bank (2 gün əvvəl)

Software Developer - 611 xal

E. Hacı - 602 xal

Onar Alili - 526 xal

Dilsuz - 448 xal

Cabbarov Sübhan - 423 xal

Maqa - 341 xal

Ruslan Butdayev - 328 xal

Namiq Bəndəli - 297 xal

U.Tarlan - 244 xal

Meherremoff - 234 xal

Sistemə daxil olmuş 21793 sualdan 93%-dən çoxu cavablandırılmışdır.

Proyekt haqqında

E-Haci.net istehsalı. © 2010-2019