duminică, 7 octombrie 2012

Cum poti realiza o cautare optima a informatiei pe internet ?


Se intampla adesea sa cautam in contra timp o anumita informatie pe internet, insa rezultatele motorului de cautare sunt cu totul nerelevante pentru ceea ce dorim sa obtinem.
Toata lumea a auzit de motorul de cautare Google de pe internet. Intrebarea este daca acesta este cu adevarat cel mai util motor pentru cautare dintr-o gama larga de alte posibilitati?
Critici pot fi adresate cu privire la faptul ca mecanismul pe care se bazeaza Google (si nu numai) este acela ca toate cuvintele dintr-o pagina web sunt incluse in baza de date pentru cautare. Acest mecanism poarta denumirea de indexare full-text si desi ne permite sa gasim toate referirile la un cuvant cautat totusi s-ar putea sa nu fie ceea ce noi doream.
La introducerea unui simplu cuvant sau chiar doua motorul de cautare va afisa mii si mii de astfel de referiri iar utilizatorul va avea nevoie de ceva timp pentru a vizualiza toate acele site-uri in cautarea raspunsului dorit.

Pe langa Google mai exista:
a) Directoare Web - folosesc o tehnica de cautare aparte, prin obligarea administratorilor site-urilor de a face o descriere manuala a continutului site-urilor, o data cu inscrierea pentru logare.
In cazul directoarelor web cautarea este mai limitata, fapt ce constuie un avantaj intrucat ofera o mai buna coerenta a rezultatelor, iar subiectele afisate se bucura de cea mai mare popularitate. Motoarele vor cauta mult mai usor si repede informatia cautata.
Exemple de astfel de servicii sunt:

TopDirector – www.topdirector.ro;
Webconnect – www.webconnect.ro;
ClickLink – www.clicklink.ro;
e-Director.net – www.e-director.net;
SuperStore.ro – www.superstore.ro;
super-market.ro – www.super-market.ro;
Gimpsy – www.gimpsy.com;
Magellan- www.magellan.cc;
JoeAnt – www.joeant.com;
bwot.com – www.bwot.com;
Yahoo directories-  http://dir.yahoo.com;
Zeal – www.zeal.com;
Open Directory Project – http://dmoz.org.

b) Bibiliotecile virtuale – pentru iubitorii de literatura care vor sa caute anumite informatii despre anumite carti sau autori – exemple:
 
Agonia - http://agonia.ro/index.php;
e-scoala - www.e-scoala.ro;
cartielectronice – http://cartielectronice.blogspot.ro;
cartipentrutine - http://cartipentrutine.tripod.com;
biblior.net - http://biblior.net;
digitool – http://digitool.dc.bmms.ro:8881/R

c) Motoarele de meta-cautare – pentru ca nu au baze de date proprii, acest tip de motoare de cautare foloseste un anumit algoritm pentru a sorta intr-o lista, cu o anumita relevanta, continutul acelor site-uri cuprinse in diverse directoare si servicii web.
Motoarele de meta-cautare sunt folosite atunci  cand trebuie cautat un anumit grup de cuvinte sau fraze. Rezultatul este o lista unde sub fiecare raspuns este afisat si un cuprins ce contine succint subiectele dezbatute in respectivele pagini, in legatura cu cuvintele cautate.
Dezavantajul fiind ca nu toate bazele de date raspund la algoritmul cu care sunt setate motoarele de meta-cautare.
Exemple de astfel de motoare:

Vivisimo- www.vivisimo.com;
MetaCrawler – www.metacrawler.com;
iBoogie – www.iboogie.tv;
InfoGrid – www.infogrid.com;
Metasearch – www.metasearch.com;
Ez2Find – www.ez2find.com;
Infonetware – www.infonetware.com;
Blekko - http://blekko.com;
Ask - www.ask.com;
DuckDuckGo - http://duckduckgo.com;
Mamma - www.mamma.com;
Search - www.search.com;
Dogpile - www.dogpile.com;
Trebuie sa adaug faptul ca exista si softuri ce pot fi instalate pe propriul calculator si care functioneaza tot pe principiul motoarelor de meta-cautare. Un astfel de soft gratuit este chiar Google Desktop, ce poate fi descarcat de aici.

d) Invisible sau deep web – aceste servicii de „specially search engines” sunt create tocmai pentru a scoate la iveala toate acele informatii pe care motoarele de cautare traditionale nu le pot indexa ca urmare a incompatibilitatii algoritmului sau din diferite alte motive.
Deci acestea contin o colectie de un anumit tip de informatii indisponibile cu motoarele de cautare obisnuite.
Se vorbeste de o lume ascunsa o internetului, de proportii impresionante, de care majoritatea oamenilor nu stiu ca exista, intrucat sunt gresit indoctrinati ca doar acele motoare de cautare arhicunoscute merita a fi folosite. Multi utilizatori nici nu cunosc faptul ca mai exista si alte posibilitati de cautare in afara celor notorii. Exemple de astfel de motoare:

TechXtra - www.techxtra.ac.uk;
Pro Fusion – www.profusion.com;
Scirus - www.scirus.com;
Invisible-net – www.invisible-net.com;
DeepWebTech - www.deepwebtech.com;
Complete Planet – www.completeplanet.com;
Resource Discovery Network – www.rdn.ac.uk;
Direct Search - http://directsearch.net;
Infomine - http://infomine.ucr.edu;
WWW Virtual Library - http://vlib.org;
Intute - www.intute.ac.uk;
Infoplease - www.infoplease.com

In cazul motoarelor de cautare cine alege insa sa afiseze toate acele rezultate ? Selectia este realizata de niste programe, numite „spider” (paianjen) sau „robots” (roboti), ce functioneaza in mod automat, fiind setate sa indexeze  cautarile si sa afiseze intai rezultatele obtinute de pe cele mai vizitate site-uri sau de pe acelea care se prezinta doar sub un anumit specific sau domeniu de interes (stiri, drept si jurisprudenta, sanatate-medicina, divertisment, retete culinare etc).

Cum cautam pentru un rezultat cat mai potrivit si nimerit?

De exemplu, sunteti in cautarea unei masini second-hand, de preferinta Dacia Logan, insa nu foarte veche si nu foarte scumpa, care sa si functioneze bine. Pentru a cauta pe internet in loc de Vreau sa-mi cumpar automobil Dacia, de preferinta Logan, la pret mic, nu foarte veche, care sa arate si sa functioneze bine, fara defecte prea mari veti introduce inversul a ceea cereti (ca si cum ati oferi si nu cauta), respectiv: vand Logan ieftin,  pret, anul 2006, km, defecte, stare buna
Dupa cum observati pe langa faptul ca m-am adresat ca si cum as fi vanzatorul si nu cumparatorul am inlocuit fraza de mai sus cu unele sinonime, precum si cu cuvinte sau fraze ce urmeaza un anumit tipar al logicii.
Respectiv in loc de Dacia Logan  am scris simplu Logan si asta pentru ca motorul de cautare intalnind cuvantul „Dacia” ar fi afisat si alte tipuri de automobil decat cel dorit, respectiv: Dacia 1300, 1310, 1200, 1400, Super Nova, 1100 Berlina etc.
Succesiunea cuvintelor „ieftin, pret” sunt menite sa afiseze  acele automobile Logan aflate la pret mic, motorul de cautare indexand doar descrierile facute de vanzatori pe paginile web. Daca as fi adaugat si cuvantul „euro” motorul de cautare ar fi afisat in mod sigur si pretul cerut de vanzator.
„Anul 2006” inlocuieste cuvintele „nu foarte veche”, pentru ca majoritatea celor care fac anunturi cu privire la vanzarea masinilor nu scriu in descrierea lor astfel de cuvinte.
De asemenea anul fabricatiei 2006 scris alaturi de cuvantul „Km” sau „kilometraj”, pentru ne arata si nr. de kilometri parcursi de automobil, precum si cuvintele „defecte” si „stare buna” sunt toate menite sa determine motorul de cautare sa ne ofere acele informatii de care avem nevoie pentru a ne forma o imagine cat mai buna  asupra  functionalitatii si conditiei in care se afla automobilele scoase la vanzare.
Dezavantajul este ca desi motorul de cautare gaseste ceea ce cautam, totusi atunci cand deschidem pagina site-ului respectiv vom fi intampinati de o lista ce cuprinde mai multe articole cu privire la vanzarea automobilelor, in care se afla si articolul vizualizat anterior de motorul de cautare.
Schimbarea sinonimelor va fi de asemenea benefica pentru afisarea a mai multor rezultate, tinand cont de faptul ca oamenii pot sa folosesca in descrierile lor termeni diferiti, inclusiv jargoane.
Asocierea unor cuvinte asemanatoare ca forma sau omonimele pot impiedica aparitia raspunsului dorit sau afisarea a mai multor rezultate fara relevanta. Un astfel de exemplu ar fi cuvintele cal mare (cal – animal, mare- proportie) pentru care motorul de cautare va afisa si cuvantul calmare, respectiv o serie de recomandari si retete pentru calmarea durerilor. La fel si in cazul omonimelor. Tocmai de aceea este indicata folosirea in asociere a sinonimelor, pentru a inlatura asemanarile nedorite.

Metoda trunchierii cuvintelor.
Aceasta metoda a fost dezvoltata mai mult pentru scrierea cuvintelor englezesti, dar exista si caractere, mai putine la numar, ce pot fi folosite cu succes si in cazul cuvintelor romanesti. Metoda implica folosirea anumitor caractere, aflate pe tastatura, care pot fi introduse in continutul cuvintelor, la inceputul sau la sfarsitul lor.

In cazul limbii engleze avem doua forme de cuvinte pentru a exprima ceea ce in romaneste se numeste „femeie”, respectiv „woman” si „women”.
Pentru a le gasi pe amandoua se introduce caracterul „*” intre m si n, respectiv se va cauta cuvantul „wom*n” pentru a fi afisate ambele cuvinte.
Caracterul „*” se foloseste in interiorul cuvantului iar caracterul „$” se foloseste la sfarsitul acestuia. Exemplu, pentru „child” vom scrie in motorul de cautare „child$” pentru a se gasi toate formele acestui cuvant (childhood, children).
Nu toate motoarele de cautare sunt setate sa accepte aceleasi caractere, astfel ca s-ar putea ca in loc de „*” sa fie nevoie de fapt de „#” sau „?”.

Pentru cuvintele romanesti cel mai util ar fi sa folositi caracterul „_” (underscore, semnul pentru subliniat sau liniuta jos).  
Daca dam o cautare pe Google pentru „copi$” vom constata ca motorul afiseaza rezultate neconcludente, dar daca cautam „copi_” atunci cautarea ne duce la cuvantul dorit.
De asemenea pentru a cauta substativul „Bucuresti”, fara literele „re” din continut, sub forma „Bucu__sti” motorul ne va da rezultatul dorit, la fel si pentru „_ucuresti”, spre deosebire daca am folosi orice alt caracter.
Deci caracterul „_” poate fi folosit atat in interiorul cuvintelor romanesti cat si la inceputul sau sfarsitul lor si poate inlocui chiar si mai mult de o litera.
Acest lucru trebuie retinut pentru ca va fi foarte folositor atunci cand cunoastem, spre exemplu, pronuntia unui cuvant dar nu stim sigur ce caractere s-au folosit pentru scrierea lui. De exemplu, pentru „München” putem cauta „M_nchen”. Dar sun „N” exemple de denumiri sau nume in care apar caractere sau litere de care nu suntem siguri pentru ca acestea nu se folosesc in mod obisnuit in scrierea si exprimarea romaneasca.
De asemenea un alt bun exemplu despre utilitatea folosirii caracterului „_” este daca l-am folosi in expresia vand Dacia, anul 200_, caz in care motorul Google ne va afisa toate ofertele de masini Dacia fabricate din anul 2000 si pana in 2009 inclusiv.

Cautarea dupa fraze. Se introduce in motorul de cautare fraza exacta sau cuvintele exacte incadrate intre gilimele („”).
Nu de mult am cautat pe Google fraza: alte atributii la dispozitia sefului ierarhic, fara sa o introduc intre ghilimele. Rezultatul a fost total nesatisfacator, motorul afisandu-si rezultatele insa fara nici o relevanta cu ceea ce eu cautam. Indata ce am introdus intre ghilimele fraza de mai sus, motorul mi-a raspuns prompt si la obiect.
Dumneavoastra veti avea nevoie de ghilimele pentru a incadra titlul unei carti sau al unui film, ori o fraza dintr-un act normativ anume, pentru care ati uitat numarul si anul aparitiei.
Insa si anumite cuvinte simple le puteti incadra in ghilimele iar motorul va intelege ca acel cuvand trebuie sa apara in mod obligatoriu in cautarea respectiva. Exemplu: vand „Dacia Logan”, anul „2006”, ieftin, stare buna – motorul de cautare va afisa rezultate ce vor contine obligatoriu termenii Dacia Logan, 2006.

Operatori logici (Boolean Operators).
 Acestea sunt cuvintele din limba engleza scrise cu majuscule: NOT, OR, AND, SAME, NEAR.
 
NOT – Este folosit pentru a indeparta din rezultatele cautarii un anumit cuvant ce poate aparea invariabil la cel cautat de noi.

OR – Se foloseste in cazul sinonimelor sau pentru a asocia anumiti termeni ce trebuie sa se regaseasca intr-o cautare. De exemplu s-ar putea ca pentru vanzarea unei masini sa apara in diverse anunturi cuvantul „automobil” si nu „masina”.
Pentru a gasi ambele forme de exprimare se va scrie: vand automobil OR masina.

AND – Se foloseste pentru acele cuvinte pentru care exista un omonim. Daca este scris intre doua cuvinte motorul de cautare va afisa doar acele rezultate in care apar impreuna ambele cuvinte respective.  De exemplu in cazul cuvantului „leu” cu sensul de moneda motorul de cautare va afisa si omonimul ce defineste un anumit mamifer carnivor.
Astfel ca vom cauta cuvantul „leu” urmat de AND si de folosirea unui alt cuvant menit sa restranga cautarile, cum ar fi „romanesc”. Rezultatele vor fi afisate doar pentru cuvintele leu romanesc.

SAME – este folosit pentru a afisa doua cuvinte ce se gasesc in mod separat intr-o pagina, deci nu neaparat impreuna. Respectiv pentru a avea rezultate separate atat pentru „leu” cat si pentru „moneda” vom scrie: leu SAME moneda.

NEAR – spre deosebire de operatorii logici AND si SAME, acesta va afisa cuvintele cautate care se regasesc intr-o pagina, indiferent daca acestea sunt apropiate sau rasfirate ca si pozitie unul fata de celalalt ori daca in continut exista referire la doar un singur termen. Astfel ca pentru cautarea: automobil NEAR Dacia motorul va afisa atat rezultatele ce contin cei doi termeni impreuna Automobil Dacia cat si pe cele in care automobil si dacia apar in mod separat unul de celalalt, precum si rezultate in care se face referire la un singur termen.

Tinand cont de faptul ca unele motoare de cautare nu recunosc toti operatorii de mai sus (cum ar fi Google) in locul lui NOT se poate folosi cu succes semnul minus, respectiv (-) Asadar daca vrem sa cautam cuvantul leu insa fara referiri la horoscop sau zodiac vom scrie pentru cautare forma: leu –zodiac –horoscop.

Acelasi lucru este valabil si pentru echivalentul operatorului AND, respectiv caracterul plus (+).

Avand in vedere cele aratate mai sus toate aceste comenzi pot fi folosite impreuna, in diverse combinatii pentru a optimiza cautarile. Asfel ca pentru comanda de cautare simpla: vand Logan ieftin,  pret, anul 2006, km, defecte, stare buna vom putea restrange cautarile daca dorim acest lucru.
Putem scrie: „vand” „Dacia” AND „Logan” SAME anul „2006” OR ieftin OR pret OR stare buna NEAR km OR defecte -1300 -1310 -Berlina
Motorul va cauta obligatoriu cuvintele vand, Dacia Logan,  2006, iar alaturi de ele se vor gasi si cuvintele pret, stare, ieftin si optional km, defecte, iar in ce priveste 1300, 1310 sau Berlina acesti termeni vor fi exclusi din cautare.

Dar dumneavoastra va puteti folosi logica si sa dati comenzi pentru a gasi raspunsul sub forma pe care o doriti folosind:
- ghilimelele („”) pentru a incadra acele fraze sau cuvinte ce trebuie neaparat sa apara in rezultate;
- semnul minus (-) pentru a elimina din cautare cuvintele sau termenii ce tind sa apara in mod neconcludent cu cautarea dumneavoastra. Folosind (-) puteti exclude din cautari si rezultatele de pe un anumit site, daca veti scrie si numele site-lui in dreptul semnului.
- Operatorii logici (OR, AND, SAME, NEAR) in amestecul si combinatiile pe care le doriti tinand cont de descrierea facuta fiecaruia mai sus.

Un comentariu:

  1. Hi, yeah this paragraph is truly nice and I have learned lot of things from it concerning blogging.
    thanks.
    My web page :: Inscriere in peste 2300 pagini - Promovare web

    RăspundețiȘtergere

Comentariul dumneavoastra va fi postat imediat ce va fi validat de un moderator