Căutare avansată și limba de interogare. Limbajul motorului de căutare
Limba de interogare este o limbă de programare creată artificial pentru a face interogări în bazele de date și în sistemele informatice.
conținut
- Baze de date
- Motoarele de căutare
- Cum sunt clasificate interogările de căutare?
- Cum se efectuează recuperarea informațiilor?
- Caracteristicile acțiunilor personalizate
- Frecvența interogărilor distribuții
- Întrebări structurate
- Ce este căutarea avansată?
- Cum se citesc caracterele din limba de interogare?
- Sintaxă
- Parametri de căutare particularizați
În general, astfel de metode de interogare pot fi clasificate în funcție de faptul că acestea servesc pentru o bază de date sau pentru recuperarea informațiilor. Diferența este că cererile pentru astfel de servicii sunt făcute pentru a obține răspunsuri reale la întrebările adresate, în timp ce motorul de căutare încearcă să găsească documente care conțin informații referitoare la regiunea de interes pentru utilizator.
Baze de date
Limbile de interogare pentru bazele de date includ următoarele exemple:
- QL - orientat pe obiect, se referă la baze de date relaționale- succesor al Datalog.
- Contextual (CQL) este o limbă oficială de reprezentare a interogărilor pentru sistemele de recuperare a informațiilor (cum ar fi indexurile web sau directoarele bibliografice).
- CQLF (CODYASYL) - pentru bazele de date CODASYL-TYPE.
- Limba de interogare orientată pe concept (COQL) este utilizată în modelele corespunzătoare (com). Se bazează pe principiile modelării datelor și utilizează astfel de operațiuni, cum ar fi proiecția și de-proiecția analizei multidimensionale, a operațiilor analitice și a concluziilor.
- DMX - utilizat pentru modelele de date miniere.
- Datalog este limba de interogare a bazelor de date deductive.
- Gellish English este o limbă care poate fi utilizată pentru interogări în bazele de date Gellish English și vă permite să efectuați dialoguri (interogări și răspunsuri) și să serviți și pentru Modelarea informațiilor cunoaștere.
- HTSQL - traduce solicitările http la SQL.
- ISBL - folosit pentru PRTV (unul dintre primele relații sisteme de gestionare a bazelor de date).
- LDAP este un protocol pentru solicitări și servicii de director care rulează pe TCP / IP.
- MDX este necesar pentru bazele de date OLAP.
Motoarele de căutare
Limbajul interogărilor de căutare, la rândul său, vizează găsirea de date în motoarele de căutare. Diferă în faptul că cererile conțin adesea text simplu sau hipertext cu o sintaxă suplimentară (de exemplu, "și" / "sau"). Diferă semnificativ de limbile similare, care sunt reglementate de reguli stricte de sintaxă de comandă sau conțin parametri poziționali.
Cum sunt clasificate interogările de căutare?
Există trei categorii largi care acoperă majoritatea interogărilor de căutare: informații, navigare și tranzacționare. Deși această clasificare nu a fost stabilită teoretic, a fost confirmată empiric de prezența unor interogări reale în motoarele de căutare.
Solicitările de informații sunt acelea care acoperă teme generale (de exemplu, un anumit oraș sau model de camion) pentru care pot fi obținute mii de rezultate relevante.
Navigare - acestea sunt interogări care caută un site sau o pagină web pe un anumit subiect (de exemplu, YouTube).
Tranzacțional - reflectă intenția utilizatorului de a efectua o anumită acțiune, cum ar fi, de exemplu, cumpărarea unei mașini sau rezervarea unui bilet.
Motoarele de căutare sprijină adesea cel de-al patrulea tip de interogare, care este utilizat mult mai rar. Acestea sunt așa-numitele solicitări de conectare care conțin un raport privind conectivitatea graficelor web indexate (numărul de linkuri către o anumită adresă URL sau câte pagini sunt indexate dintr-un anumit domeniu).
Cum se efectuează recuperarea informațiilor?
Majoritatea resurselor de căutare nu își dezvăluie jurnalele de căutare, astfel încât informațiile despre ce căutăm utilizatorii pe web sunt foarte greu de găsit. Cu toate acestea, prima cercetare științifică a apărut în 1998. Mai târziu, în 2001 a fost realizat un studiu ulterior, care a analizat interogări care au fost afișate ca fiind foarte relevante. De asemenea, a devenit clar modul în care căutați roboți limba de interogare.
Caracteristici interesante legate de căutarea pe web au devenit cunoscute:
Lungimea medie a interogării de căutare a fost de 2,4 cuvinte.
- Aproximativ jumătate dintre utilizatori au trimis o cerere și puțin mai puțin de o treime dintre utilizatori au făcut trei sau mai multe interogări unice unul câte unul.
- Aproape jumătate dintre utilizatori au văzut doar primele una sau două pagini ale rezultatelor.
- Mai puțin de 5% dintre utilizatori utilizează funcții de căutare avansată (de exemplu, alegerea anumitor categorii sau căutarea în căutare).
Caracteristicile acțiunilor personalizate
Studiul a arătat, de asemenea, că 19% din interogări conțin un termen geografic (de exemplu, nume, coduri poștale, obiecte geografice etc.). De remarcat este faptul că, în plus față de întrebările scurte (adică cu mai multe condiții), s-au prezentat deseori scheme previzibile, conform cărora utilizatorii și-au schimbat expresiile de căutare.
De asemenea, sa constatat că 33% din solicitările unui utilizator sunt repetate, iar în 87% din cazuri utilizatorul va face clic pe același rezultat. Acest lucru sugerează faptul că mulți utilizatori utilizează solicitări repetate pentru a examina sau pentru a re-găsi informații.
Frecvența interogărilor Distribuții
În plus, specialiștii au confirmat faptul că distribuția frecvențelor interogărilor corespunde unei legi privind puterea. Adică, o mică parte din cuvintele cheie este observată în cea mai mare listă de cereri (de exemplu, mai mult de 100 de milioane) și sunt cele mai des folosite. Restul fraze din aceleași subiecte sunt folosite mai rar și mai individual. Acest fenomen este numit Principiul Pareto (Sau „regula 80-20“), și este posibil să se utilizeze astfel de motoare de căutare tehnici de optimizare cum ar fi indexarea sau partiționarea bazei de date, de cache și preîncărcarea, și a oferit, de asemenea, o oportunitate de a îmbunătăți limba de interogări de motor de căutare.
În ultimii ani, sa constatat că lungimea medie a interogării crește constant în timp. Deci, interogarea medie în limba engleză a devenit mai lungă. În acest sens, Google a introdus actualizarea numit „Hummingbird“ (august 2013), care este capabil să se ocupe de expresii de căutare lungi cu nici un protocol „vorbit“ limbaj de interogare (cum ar fi „Unde este cea mai apropiată cafenea?“).
Pentru interogări mai lungi, se folosește prelucrarea acestora - acestea sunt împărțite în fraze, formulate în limba standard, iar răspunsurile la diferitele părți sunt afișate separat.
Întrebări structurate
Motoarele de căutare care acceptă operații logice și sintaxă, utilizați mai multe limbi de interogare extinsă. Un utilizator care caută documente care acoperă mai multe subiecte sau fețe poate descrie fiecare dintre ele prin caracterizarea logică a cuvântului. În centrul său, limba interogării logice este o colecție de expresii și semne de punctuație specifice.
Ce este căutarea avansată?
Limba de interogare a "Yandex" și "Google" este capabilă să efectueze o căutare mai specifică, sub rezerva anumitor condiții. Căutarea avansată poate căuta o parte din numele paginii sau prefixul antetului, precum și în anumite categorii și liste de nume. De asemenea, poate restricționa căutarea paginilor care conțin cuvinte specifice în titlu sau se află în anumite grupuri de subiecte. Cu utilizarea corectă a limbajului de interogare, acesta poate procesa parametrii cu un ordin de mărime mai complex decât rezultatele de suprafață ale majorității motoarelor de căutare, inclusiv cele date de utilizator cu cuvinte cu un capăt variabil și o ortografie similară. Când afișați rezultatele unei căutări avansate, va fi afișat un link către secțiunile relevante ale paginii.
De asemenea, este posibil să căutați toate paginile care conțin o expresie specifică, în timp ce cu o interogare standard, motoarele de căutare nu se pot opri pe nici o pagină a discuției. În multe cazuri, limba de interogare poate duce la orice pagină din etichetele noindex.
În unele cazuri, o interogare bine formată vă permite să găsiți informații care conțin un număr de caractere și litere speciale de la alții alfabete (chineză hieroglife, de exemplu).
Cum se citesc caracterele din limba de interogare?
Caracterele superioare și literele mici, precum și unele semne diacritice (umlauturi și accente) nu sunt incluse în căutare. De exemplu, căutarea cuvântului cheie Citroen nu găsește pagini care conțin cuvântul "Citroen". Dar unele ligaturi corespund literelor individuale. De exemplu, o căutare pentru cuvântul "aeroscop" va găsi cu ușurință pagini care conțin "Ereskebing" (AE = Æ).
Multe caractere non-alfanumerice sunt în mod constant ignorate. De exemplu, este imposibil să găsiți informații despre o interogare care conține șirul | L | (litera dintre două bare verticale), în ciuda faptului că acest simbol este utilizat în unele șabloane de conversie. Doar datele din LT vor fi în rezultate. Unele simboluri și expresii sunt tratate în moduri diferite: interogarea "credit (Finance)" afișează articole cu cuvintele "credit" și "finanțe", ignorând parantezele, chiar dacă există un articol cu numele exact "credit (Finance)".
Există multe funcții care pot fi utilizate cu limba de interogare.
sintaxă
Limba de interogare a "Yandex" și "Google" poate utiliza câteva semne de punctuație pentru a rafina căutarea. De exemplu, parantezele curbate sunt {{search}}. Fraza inclusă în ele va fi căutată în întregime, fără modificări.
Fraza în ghilimele duble vă permite să determinați obiectul căutării. De exemplu, un cuvânt citat va fi recunoscut ca fiind folosit figurativ sau ca personaj fictiv, fără citate - ca o informație mai documentară.
În plus, toate motoarele de căutare importante suportă caracterul ";" pentru "nu", precum și / sau. O excepție este termenii care nu pot fi separați utilizând un prefix de liniuță sau dash.
Corespondența incorectă a expresiei de căutare este marcată cu simbolul ~. De exemplu, dacă nu vă amintiți formularea exactă a unui termen sau a unui titlu, îl puteți specifica în șirul de căutare cu caracterul specificat și veți putea obține rezultate cu cea mai mare asemănare.
Parametri de căutare particularizați
Există, de asemenea, parametri de căutare, cum ar fi intitle și incarca. Acestea sunt filtre afișate prin colon, sub forma "filtr: șir de interogare". Șirul de interogare poate conține termenul de căutare sau fraza sau numele paginii complete sau parțiale.
Funcția "intitle: query" acordă prioritate rezultatului căutării după nume, dar prezintă, de asemenea, rezultatele obișnuite pentru conținutul titlului. Mai multe astfel de filtre pot fi utilizate simultan. Cum să folosiți această oportunitate?
Cererea pentru tipul "intitle: name of airport" va conține toate titlurile care conțin titlul aeroportului în titlu. Dacă îl formulezi ca "parcare intitle: numele aeroportului", atunci vei primi în titlu numele articolelor cu numele aeroportului și vei menționa parcarea în text.
Filtrați căutarea "Categorie: Categorie" funcționează pe principiul emiterii inițiale a articolelor aparținând unui anumit grup sau pe o listă de pagini. De exemplu, o interogare de căutare pentru tipul "Temple incategory: History" va produce rezultate asupra istoricului templelor. Această funcție poate fi de asemenea utilizată ca una extinsă, prin setarea mai multor parametri.
- Tipuri de bază de interogări de căutare
- Baza de date este un sistem complex
- Fișier SQL. Formatul de fișier SQL: descrierea extensiei
- MySQL este ceea ce și unde se aplică?
- Cum se compun interogările SQL - exemple detaliate
- Lista limbajelor de programare. Limbi de programare de nivel scăzut și înalt
- Lucrul cu baza de date: care sunt solicitările
- MySQL - ce este? Eroare MySQL
- DB este ... Tipuri și proprietăți ale bazei de date
- MySQL - cererea în cerere. MySQL: exemple de interogări. Întrebări interogate MySQL
- SQL unde: metode de aplicare și exemple
- Cum se sortează SQL?
- Interogarea SQL este ceea ce?
- Crearea interogărilor în Access. Tipuri de cereri
- Șterge instrucțiunea Șterge MySQL
- Ștergerea duplicatelor MySQL
- Ce este relevanța
- Cum se creează o bază de date și ce este SQL?
- Structura bazei de date
- Cum se creează interogări în Access: instrucțiuni pas cu pas și recomandări
- Ce ar trebui să fac dacă am o interogare de căutare goală în Yandex?