Axtarış Algoritmləri ilə Bağlı

Salam. Deməli, mənim əlimdə milyona yaxın 500-600 söz olan mətnlər var və mən bu mətnlərdə axtarış edən proqram yazmaqdayam. Amma bu mətnlərdə, yəni cədvəlin sətirlərində (table rowlarında) axtarış edərkən çox uzun çəkir(Levenstein metodu ilə mətndə yaxın sözü axtarıram). 60 sətir bir saniyə təqribən (O(n)). Həll üçün fikirlərini eşitmək istəyərdim. (Indexləmə haqqında məlumat yığıram hazırda.)


Yadda saxlama
Kateqoriya: Web skriptlər, kod həlləri . , , , , , , . Qısa keçid.

Verilmiş cavablar və yazılan şərhlər (2 cavab var)

(01:39, 21/01/2012 ) #7164

Salam.
Axtarış nəhəngləri yəqin qat-qat optimal yollardan istifadə edirlər, amma inanmıram ki, bu adi siz deyən funksiyanın sürətindən eksponensial fərqlənən metodlara malikdirlər, yox məncə üstünlük polinomialdır. Onlara üstünüyü verən super serverlərdir. 1000 dəfələrlə daha üstün parametrlərə malik serverlə bizim localhostumuzun işlədiyi kompüterimiz təbii ki eyni sürətlə işləyə bilməz 🙂
Sizin situasiyada əlavə psevdohəllər təklif edərdim.
Keywordlər-dən istifadə etmək.
Oxşar sözlərin ayrıca table-ni qurmaq(İD,Incorrect,Correct). Məsələn user Cvablar sözünü axtarırsa bu yoxlasın ki həmin table-da Cvabların correct variantı varmı, varsa elə korrektin özünü axtarsın böyük table-ın özündə, yoxdursa o halda yeni cütlüyü əlavə etsin bu table-a və sonra oxşarlıq metodu ilə axtarsın çətin də olsa, amma əvəzində bu səhv variantı ikinci dəfə axtaranda artıq çox çevik nəticə verəcək, çünki table-da artıq bu cütlük var. Düşünərəm, başqa təkliflərim olsa yazaram 🙂

Cavablamaq üçün sağ sütundan hesaba daxil olmaq lazımdır

(16:05, 25/01/2012 ) #7394

Siz deyən yoldan getdim. Amma səhv sözləri tək-tək clusterə əlavə etmək xeyli vaxt alacaq deyə bir az metamorfoza məruz qaldı. Təsəvvür etsək ki, bu yeni mətnlər əlavə etdikcə dəyişəcək, clusterlər da dəyişilməli olur. Başqa metodla etdim, hələ ki, bir problem çıxartmayıb: mətndəki sözləri distinct olaraq all_words deyə bir table-a atıram və axtarışa verilən sözə ən yaxın sözləri levenstein methodu ilə tapıram. nə qədər yaxın olduğuna görə ranking də edə bilirəm. (nolsun localhostdayıq 🙂 1-2 saniyə arası vaxt alır 8000 söz var bazada hələki ) trie strukturunu istifadəsini məsləhət gördülər. Əgər indiki halında bir nasazlıq yaransa, trie haqqında fikirləşəcəm.

Cavablamaq üçün sağ sütundan hesaba daxil olmaq lazımdır

Bu suala aid öz sualım var:
Sual verin
Bu suala cavab vermək istəyirəm:
Cavab verin

Cavab verin


Cavab yazmaq üçün lütfən sağ sütundan və ya buradan hesaba daxil olun.

Üzvlər üçün giriş

Qeydiyyat

Elan qutusu

Son cavablar və şərhlər

MiMov cavab verdi - Özəl ip tv qurmaq (4 gün əvvəl)

MiMov cavab verdi - iptv onlayn paket almaq (4 gün əvvəl)

E. Hacı cavab verdi - 300$ Gömrük Limitini keçdim (11 gün əvvəl)

Software Developer cavab verdi - Aliexpress gömrük rüsumu nəyə görə hesablanır? (12 gün əvvəl)

AliyevYT cavab verdi - Honeygain, passiv gelir (13 gün əvvəl)

Sıradan biri cavab verdi - IMEI qeydiyyatı (15 gün əvvəl)

Fariz Huseynli cavab verdi - cerimenin öyrənilməsi (18 gün əvvəl)

Software Developer cavab verdi - cerimenin öyrənilməsi (19 gün əvvəl)

Software Developer cavab verdi - Kapital bank rekvizit payoneer (19 gün əvvəl)

Software Developer cavab verdi - Hər hansı kompyuter proqramının (EXE faylı) etibarlı olub olmaması yəni qanuni və ya saxta olduğunu necə bilmək olar ? (19 gün əvvəl)

txmn cavab verdi - Hərbi biletsiz, möhlətsiz iş (22 gün əvvəl)

Galaxy cavab verdi - X-də (Twitter) premium abunəliklə bağlı çətinlik (22 gün əvvəl)

Rsad Ncfli cavab verdi - Payonner 2024 ilə bağlı sual (28 gün əvvəl)

Software Developer cavab verdi - Payonner 2024 ilə bağlı sual (28 gün əvvəl)

Rsad Ncfli cavab verdi - Payonner 2024 ilə bağlı sual (28 gün əvvəl)

Software Developer - 615 xal

E. Hacı - 607 xal

Onar Alili - 526 xal

Dilsuz - 448 xal

Cabbarov Sübhan - 434 xal

Maqa - 346 xal

Ruslan Butdayev - 328 xal

Namiq Bəndəli - 297 xal

U.Tarlan - 244 xal

Meherremoff - 234 xal

Sistemə daxil olmuş 23229 sualdan 92%-dən çoxu cavablandırılmışdır.

Proyekt haqqında

E-Haci.net istehsalı. © 2010-2024