Mitä on kanonisointi?

Sana kanoninen tarkoittaa jotain, joka on hyväksytyn standardin mukainen. Kanonisointi – tai englanninkielisenä kanonisointi – on prosessi, jossa jotain saatetaan hyväksytyn standardin mukaiseksi. Tietokoneiden alalla kanonisoinnin termillä viitataan standardien täyttämiseen useilla eri alueilla. Sitä pidetään usein ongelmana, vaikka se on itse asiassa ratkaisu moniin ongelmiin. Koska kanonisointi on niin pitkä sana, sitä lyhennetään käyttämällä sen ensimmäistä ja viimeistä kirjainta ja niiden välissä olevaa kirjainten määrää: c14n.

Kanonisointia käytetään tietotekniikassa (IT) useissa asetuksissa. Se viittaa sähköpostin lähettäjän osoitteisiin, tiedostonimen rakentamiseen, merkkijonokoodaukseen Unicodessa, XML: n (EXtensible Markup Language) käyttöön ja URL (Uniform Resource Locator) -rakenteeseen. Kaikissa tapauksissa ongelma on kapasiteetti useille muodoille, jotka edustavat samaa kohdetta, ja kanonisointi on tapa johdonmukaisuuteen ja standardointiin.

Otetaan esimerkkinä XML. XML mahdollistaa syntaktiset muutokset. Tämä tarkoittaa, että kahdella asiakirjalla, jotka eivät ole identtisiä, voi olla sama kanoninen muoto ja siten ne voivat olla toiminnallisesti samanarvoisia. Canonical XML -määritys on suunniteltu vastaamaan tähän luomalla menetelmä, jolla voidaan määrittää erillisten asiakirjojen henkilöllisyys. Menetelmää kanonisen muodon luomiseksi mille tahansa XML -asiakirjalle kutsutaan XML -kanonisointimenetelmäksi.

URL -osoitteen ensisijaiseksi määrittämisen tarkoituksena on viitata tiettyyn verkkosivustoon johdonmukaisesti yhden URL -osoitteen perusteella. Yksinkertaisin esimerkki on kaksi kotisivun versiota, joista toisessa on kolme w: tä ja toisessa ei:

http://www.Same OG.com

vastaan
http://Same OG.com
Tämä on ongelma hakukoneoptimoinnille (SEO), koska se jakaa raportit liikenteestä, joka kaikki todella menee samaan paikkaan. Tuloksena on, että sivusto, jolla on useita URL -osoitteita samoille sivuille, näyttää toimivan huonommin kuin se todellisuudessa on.
W: n lisäksi on muitakin ongelmia. Näitä ovat loppuviivat ja erot isoilla ja pienillä kirjaimilla varustettujen URL -versioiden välillä. Matt Cutts Googlesta® suosittelee ratkaisemaan tämän käyttämällä kaikkien vaihtoehtoisten URL -osoitteiden pysyvää (301) uudelleenohjausta haluamaasi URL -osoitteeseen, jolloin hakukoneet voivat päättää, mikä on ensisijainen URL -osoite.