ChatGPT pretraživanje koristi Microsoftovu tehnologiju pretraživanja Bing i tri različita robota za indeksiranje
Prošlog tjedna OpenAI je pokrenuo funkciju web pretraživanja ChatGPT Search, koja je također u biti tražilica, tako da je u izravnoj konkurenciji Google pretraživanju. Što se tiče prikupljanja podataka, OpenAI koristi dva izvora tehnologije: s jedne strane, tehnologija pretraživanja koristi Microsoft Bing, a s druge strane, OpenAI također sam struže sadržaj, a svi će podaci biti sortirani prema određenom algoritmu nakon što se izgrebu kako bi se rezultati vratili korisnicima u ChatGPT-u.
Iako OpenAI u svom blogu nije otkrio da se Microsoft Bing koristi za njegovu tehnologiju pretraživanja, njegovi inženjeri potvrdili su na forumu Reddit da se Bing pretraživanje doista koristi, pa webmasteri optimiziraju SEO za Bing pretraživanje ako žele dobiti promet pretraživanja putem ChatGPT-a.
Što se tiče alata za indeksiranje, trenutno postoje 3 različita robota za indeksiranje u OpenAI-ju, a korištenje sljedećih oznaka robots.txt omogućuje webmasterima da upravljaju načinom na koji njihove web stranice i sadržaj rade s umjetnom inteligencijom:
- GPTBot: Koristi se za prikupljanje podataka s Interneta za treniranje OpenAI-jevog modela umjetne inteligencije, alat za indeksiranje može maskirati promet pretraživanja koji ne utječe na web stranice;
- ChatGPT-korisnik: Koristi se za dohvaćanje informacija s weba za označavanje izvorne veze kada korisnik postavi pitanje. Sam alat za indeksiranje neće indeksirati informacije o web stranici;
- OAI-Search: Ovo je alat za indeksiranje koji OpenAI koristi za funkciju pretraživanja ChatGPT pretraživanja, koja je posebno dizajnirana za dobivanje mrežnih podataka, ali neće koristiti podatke za obuku AI modela.
S gore navedenim oznakama, webmasteri mogu dopustiti OAI-SearchBotu da se pojavi u rezultatima pretraživanja, dok onemogućuju GPTbot kako bi naznačili da se indeksirani sadržaj ne bi trebao koristiti za treniranje OpenAI-jevog generativnog AI osnovnog modela. Nakon ažuriranja robots.txt web stranice, može proći oko 24 sata da se sustav prilagodi.
