Domov audio Čo je to ťažba webu? - definícia z technológie

Čo je to ťažba webu? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená ťažba na webe?

Web mining je proces využívajúci techniky a algoritmy získavania údajov na extrahovanie informácií priamo z webu ich extrahovaním z webových dokumentov a služieb, webového obsahu, hypertextových odkazov a protokolov servera. Cieľom ťažby na webe je hľadať vzory vo webových údajoch zhromažďovaním a analýzou informácií s cieľom získať prehľad o trendoch, odvetví a všeobecne o používateľoch.

Techopedia vysvetľuje ťažbu na webe

Web mining je odvetvie dolovania dát, ktoré sa sústreďuje na World Wide Web ako primárny zdroj údajov vrátane všetkých jeho komponentov od webového obsahu, protokolov serverov až po všetko medzi tým. Obsah údajov vyťažených z webu môže byť súbor faktov, ktoré majú webové stránky obsahovať, a tieto môžu pozostávať z textu, štruktúrovaných údajov, ako sú zoznamy a tabuľky, a dokonca aj obrázkov, videa a zvuku.


Kategórie ťažby webu:

  • Dolovanie webového obsahu - Jedná sa o proces získavania užitočných informácií z obsahu webových stránok a webových dokumentov, ktorými sú väčšinou textové, obrazové a zvukové / obrazové súbory. Techniky použité v tejto disciplíne boli do značnej miery čerpané zo spracovania prirodzeného jazyka (NLP) a získavania informácií.
  • Dolovanie štruktúry webu - Jedná sa o proces analýzy uzlov a štruktúry pripojenia webovej stránky pomocou teórie grafov. Z toho je možné získať dve veci: štruktúru webovej stránky z hľadiska jej prepojenia na iné webové stránky a štruktúru dokumentu samotnej webovej stránky, ako je prepojená každá stránka.
  • Dolovanie využívania webu - Jedná sa o proces získavania vzorov a informácií z protokolov servera, aby ste získali prehľad o aktivite používateľov vrátane informácií o tom, odkiaľ sú používatelia, koľko kliknutí kliklo na ktorú položku na webe a typy činností, ktoré sa na webe vykonávajú.
Čo je to ťažba webu? - definícia z technológie