Mikä on tekstitiedosto?

Tekstitiedosto on tietokonetiedosto, joka tallentaa kirjoitetun asiakirjan aakkosnumeeristen merkkien sarjana, yleensä ilman visuaalisia muotoilutietoja. Sisältö voi olla henkilökohtainen muistiinpano tai luettelo, aikakauslehti- tai sanomalehti -artikkeli, kirja tai muu teksti, joka voidaan tulkita tarkasti kirjoituskoneella. Tekstitiedostot ovat samankaltaisia ​​kuin tekstinkäsittelytiedostot, koska molempien sisältö on pääasiassa tekstitiedostoja; ne eroavat toisistaan ​​siinä, että tekstitiedostot eivät yleensä tallenna tietoja, kuten merkkityyliä ja kokoa, sivuja tai muita yksityiskohtia, jotka määrittäisivät valmiin asiakirjan ulkonäön. Jotkut tietokoneiden käyttöjärjestelmät tekevät peruseron tekstitiedoston, joka on tarkoitettu käännettäväksi suoraan ihmisen luettavaksi tekstiksi, ja binaaritiedoston välillä, jotka tietokone tulkitsee suoraan.

Useimmissa tekstin koodausmenetelmissä kullekin merkille annetaan numeerinen arvo, jolloin teksti kirjoitetaan binäärilukujonona. Eräästä koodausperheestä, nimeltään American Standard Code for Information Interchange (ASCII), tuli laajalti käytetty standardi varhaisessa tietojenkäsittelyhistoriassa huolimatta siitä, että se tuki heikosti muita kieliä kuin englantia. ISO 8859 -koodiperhe on tarjonnut paljon parempaa tukea latinalaisiin aakkosiin ja vastaaviin aakkosiin perustuville kielille, mutta se ei ole pystynyt koodaamaan itä -aasialaisten kielten, kuten japanin, merkkejä, mikä on johtanut yhteensopimattomien standardien lisääntymiseen.

Viime aikoina Unicode® -konsortio on kehittänyt Unicode® -nimistä koodausjärjestelmää, jonka tavoitteena on antaa yksilöllinen numero jokaiselle merkille, jota käytetään kaikilla maan kielellä. Tämä mahdollistaa yhden koodin käyttämisen jokaiselle kielelle ja useiden kielten tekstien näkymisen yhdessä tiedostossa. Unicoden ensimmäinen osa perustuu ISO 8859 -standardiin, joka perustuu ASCII -standardiin. Unicode®: n käytöstä voi olla hyötyä jopa englanninkielisissä maissa, koska vanhempien mallien avulla koodatussa tekstissä saattaa esiintyä pieniä epäjohdonmukaisuuksia siirrettäessä järjestelmästä toiseen.

Tekstitiedostojen etuja ovat pieni koko ja monipuolisuus. Kilotavua tai megatavua pienempi kuin samat tiedot, jotka on tallennettu muihin formaatteihin, ne voidaan vaihtaa nopeasti ja massiivisesti sähköpostitse tai levyltä. Suurin osa voidaan avata tietokoneilla, joissa on erilaisia ​​käyttöjärjestelmiä, käyttäen hyvin perusohjelmistoja. Suurin haitta on muotoilun puute. Tekstitiedosto voi olla huono valinta asiakirjan esittämiseen, joka sisältää kuvia tai joka perustuu suunnitteluelementteihin sen merkityksen välittämiseksi – esimerkiksi tiedosto, joka sisältää taulukkotietoja, matemaattisia kaavoja tai konkreettista runoutta.

Tekstitiedostot on yleensä tarkoitettu ihmisten luettavaksi ja muokattavaksi, mutta kaikki eivät sisällä pääasiassa ihmisravinnoksi tarkoitettua sisältöä. Suurin osa ohjelmointikoodista tallennetaan tekstitiedostoon ennen kääntämistä-eli käännetään koneellisesti luettavaksi binääritiedostoksi. Tiedostot voivat myös sisältää koneellisesti luettavia tekstitunnisteita, jotka antavat muotoilutietoja pelkän tekstin lisäksi. Esimerkiksi HTML (Hypertext Markup Language) -tiedosto voidaan avata pelkkänä tekstitiedostona tekstieditorissa tai näyttää muotoiluna web -sivuna sen jälkeen, kun selain on tulkinnut sen. Samanlaisia ​​malleja ovat LaTeX, jota käytetään tieteellisten artikkelien asettamiseen, ja Extensible Markup Language (XML), jota käytetään tietojen jäsentämiseen.