Obsah:
Definícia - Čo znamená kanonizácia?
Kanonikalizácia je proces konverzie údajov, ktorý zahŕňa viac ako jednu reprezentáciu do štandardného schváleného formátu. Takáto konverzia zabezpečuje, že údaje sú v súlade s kanonickými pravidlami. Toto porovnáva rôzne znázornenia, aby sa zabezpečila rovnocennosť, aby sa spočítali počty odlišných dátových štruktúr, uložilo sa zmysluplné poradie triedenia a zlepšila sa účinnosť algoritmu, čím sa eliminujú opakované výpočty.
Kanonikalizácia sa používa v mnohých internetových a počítačových aplikáciách na generovanie kanonických údajov z nekanonických informácií. Kanonické znázornenie údajov sa v roku 2006 bežne používa
optimalizácia pre vyhľadávače (SEO), webové servery, Unicode a XML.
Tento výraz sa označuje aj ako C14N, štandardizácia alebo normalizácia.
Techopedia vysvetľuje kanonizáciu
V SEO sa canonicalization URL zaoberá webovým obsahom s viac ako jednou možnou URL. Môže to spôsobiť nezrovnalosti vo vyhľadávaní, pretože vyhľadávací nástroj nemusí vedieť, ktorá adresa URL by sa mala zobraziť. Canonicalization vyberie najlepšiu URL z niekoľkých možností, zvyčajne odkazujúcich na domovské stránky. Hoci sa niektoré adresy URL zdajú rovnaké, webové servery pre adresy URL vracajú odlišné výsledky. Vyhľadávacie nástroje považujú za kanonickú formu iba jednu adresu URL.
Počítačová bezpečnosť je založená na kanonizácii názvu súboru. Niektoré webové servery môžu mať bezpečnostné pravidlo na vykonávanie súborov iba v určitom adresári. Súbor sa potom spustí, iba ak má cesta v názve zadaný adresár. Osobitnú pozornosť treba venovať kontrole toho, či je názov súboru jedinečnou reprezentáciou. Takáto zraniteľnosť sa nazýva priechod adresárov.
Väčšina znakov v štandarde Unicode má kódovanie s premennou dĺžkou. Vyžaduje si to zváženie každého znaku reťazca a zložitosť validácie reťazca. Ak sa pri implementácii softvéru nezohľadňujú všetky kódovania znakov, existuje možnosť chýb. Tento problém je možné odstrániť pomocou jediného kódovania pre každý znak. Najlepšou alternatívou, ktorú môže použiť ktorýkoľvek softvér, je skontrolovať, či je reťazec kanonizovaný. Reťazce, ktoré nie sú kanonizované, môžu byť odmietnuté.
Kánonický dokument XML je dokument XML v kanonickej podobe XML. Je definovaná kanonickou špecifikáciou XML. Kanonizácia v XML eliminuje medzeru v značkách, triedi odkazy v mennom priestore a odstraňuje nadbytočné a používa konkrétne kódovanie znakov. Odstráni tiež deklarácie XML a DOCTYPE, okrem transformácie relatívnych adries URL na absolútne adresy URL.
