Nem hiszem, hogy sok idő lesz addig OpenAI a mesterséges intelligencia alapú keresőmotor fejlesztésénél is szóba kerül majd. Az új web crawler GPTBot A GPT-5 széles nyelvű modell már megjelent.
Akik használnak ChatGPT Tudom, hogy ez a széles nyelvi modell (LLM) jelenleg fut GPT-3.5, amely egy 2021 szeptemberében frissített adatkészletre van kiképezve. Tehát ha ettől a dátumtól kezdve újabb információkat kérnek, ChatGPT nem tud pontos információt adni. Természetesen az ingyenes verzióra érvényes, amely nem támogatja a kiegészítő bővítmények használatát.
A dob GPTBot, OpenAI megnyílt az út a weboldalak indexeléséhez ezen az újdon keresztül web crawler. Ahogy az olyan cégek, mint a Google, a Microsoft, a Yahoo és még sokan mások, már évek óta teszik.
A GPT-5 és az OpenAI által fejlesztett új webkukac, a GPTBot.
az új web crawler GPTBot hasznosítja web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
A webhelytulajdonosok a fájlon keresztül szabályozhatják a weboldalak indexelését robots.txt
, ugyanazokat az irányelveket használja, mint mások web crawlerés más cégeké.
Például ha egy weboldal tulajdonosa ezt nem akarja OpenAI információkat gyűjthet az oldalról, hozzáadhat robots.txt
A vonalak:
User-agent: GPTBot
Disallow: /
Még akkor is, ha úgy viselkedik web crawler, GPTBot határozott célja lesz: nyilvánosan elérhető adatok gyűjtése, miközben gondosan kerüli azokat a forrásokat, amelyek fizetőfalakkal, személyes adatok gyűjtésével vagy irányelveket sértő tartalommal járnak. OpenAI.
De van jó néhány vita, némelyikük még jogi lépéseket is vonzott a cég ellen OpenAI a magánélet védelméről és a tartalom felhasználásáról a szerzők hozzájárulása vagy a forrás azonosítása nélkül.
Júniusban a japán adatvédelmi hatóság figyelmeztetést adott ki OpenAI jogosulatlan adatgyűjtéssel kapcsolatban. Olaszország is ideiglenesen betiltotta a felhasználást az év elején ChatGPT az Európai Unió adatvédelmi törvényeinek állítólagos megsértése miatt.