Automaattinen indeksointi on tietokoneohjelman tai -algoritmin käyttäminen tiedostojen, asiakirjojen ja verkkosivustojen selaamiseen avainsanojen etsimiseksi. Tätä voidaan käyttää yksittäisissä ohjelmissa, mutta se on myös suosittu algoritmi hakukoneille, joiden on indeksoitava eri verkkosivustoja tietojensa varmistamiseksi. Automaattisen indeksoinnin etuna on, että tietokone voi helposti indeksoida ja hakea asiakirjaa paljon nopeammin kuin henkilö. Haittapuoli on, että henkilön on tehtävä indeksoija, ja indeksoija voi menettää keskeiset kohdat virheellisen ohjelmoinnin vuoksi.
Internetistä, tietokoneista ja tallennuslaitteista löytyy paljon tiedostoja. Jokainen näistä asiakirjoista koskee yleensä tiettyä aihetta, ja toistuvat sanat paljastavat asiakirjojen aiheen. Esimerkiksi lääketieteellisessä asiakirjassa käytetään tyypillisesti lääketieteellisiä termejä. Automaattinen indeksointiohjelma käy asiakirjan läpi ja luokittelee asiakirjan näiden sanojen perusteella.
Jotkin yksittäiset ohjelmat, kuten asiakirjanlukijat, pystyvät suorittamaan automaattisen indeksoinnin. Kun etsit paikallista verkkoa, tämä ominaisuus sisältyy tyypillisesti tietokantoihin, joita voi olla vaikea etsiä manuaalisesti. Suosituin paikka löytää automaattinen indeksointi on online -hakukone, koska hakukoneen on vastattava käyttäjän avainsanaa tai hakutermiä kaikkien olemassa olevien verkkosivustojen kanssa. Ilman tätä ominaisuutta ihmisten olisi vaikea löytää osuvia verkkosivustoja.
Automaattisen indeksoinnin ilmeisin etu on, että se vie työn pois ihmisiltä, jotka eivät voi skannata asiakirjaa niin nopeasti kuin tietokone. Tietokone voi myös luokitella asiakirjat skannauksen jälkeen, joten käyttäjien ei tarvitse suorittaa tätä työlästä työtä. Vaikka käyttäjien on ehkä tarkistettava organisaatiosta virheiden varalta, koska indeksoija saattaa joskus viedä asiakirjan väärin, tämä on silti helpompaa kuin tehdä kaikki manuaalisesti.
Vaikka automaattisella indeksoinnilla on monia etuja, on myös haittoja. Kuten minkä tahansa ohjelman tai algoritmin kohdalla, henkilön on luotava ohjelma. Tämä tarkoittaa, että ohjelmoijan on kerrottava indeksoijalle, miten paritetaan sanat, mikä voi johtaa epätarkkuuksiin huonosta ohjelmoinnista. Indeksointilaite ei myöskään ehkä pysty erottamaan tiettyjä sanoja toisistaan tai siinä voi olla paljon epätarkkuuksia parittomien avainsanojen vuoksi. Esimerkiksi lääketieteellinen asiakirja, jossa käsitellään kosmetiikan vaaroja, voidaan luokitella virheellisesti kauneus- ja meikkiasiakirjaksi.