Mikä on Fuzzy Matching?

Sumea vastaavuus on menetelmä, jota käytetään joissakin tietokoneohjelmissa, erityisesti niissä, jotka on suunniteltu kääntämään teksti automaattisesti eri kielten välillä. Se toimii tilanteissa, joissa ohjelmiston käyttämä tietokanta ei vastaa tarkasti tekstiä. Sen sijaan tietokanta etsii läheisiä vastaavuuksia, ja ihmisen tekemä tarkistus yleensä tarkistaa, että tämä ottelu on hyväksyttävän tarkka.

Useimmat automaattiset käännösohjelmat yksinkertaisesti vertaavat tekstiä aiempien käännösten tietokantaan. Tämä tietokanta tunnetaan yleensä käännösmuistina (TM). Jokainen uusi ja vahvistettu käännös lisätään tietokantaan, mikä tarkoittaa, että tulevat käännökset ovat yleensä tarkempia ja nopeampia.

Normaalisti TM-pohjainen käännös toimii kokonaisilla lauseilla. Jos esimerkiksi käyttäjä on aiemmin hyväksynyt tietyn ranskan lauseen oikeaksi käännökseksi: “Myymälä on avoinna arkisin klo 9-5, mutta suljetaan keskiviikkona klo 2”, ohjelmisto seuraavan kerran pyydetään kääntämään kyseinen lause, se käyttää automaattisesti samaa ranskalaista sanamuotoa kuin aiemmin.

Sumea hakutyökalu toimii tilanteissa, joissa tietty lause ei ole tullut esiin järjestelmän kääntämissä asiakirjoissa. Työkalussa joko ohjelmiston luoja tai loppukäyttäjä asettaa hyväksyttävän sumean hakutason prosenttiosuman muodossa. Jos lause on tarpeeksi lähellä yhtä aiemmin käännettyä vastaamaan tätä prosenttiosumaa, ohjelmisto neuvoo ottelun käyttäjää, antaa edellisen käännöksen ja pyytää käyttäjää vahvistamaan tai muokkaamaan ehdotettua käännöstä.

Edellisen esimerkin mukaisesti, jos sumea vastaavuuskynnys oli 90% ja uusi englanninkielinen asiakirja sisälsi lauseen: “Myymälä avataan arkisin klo 9-5, mutta suljetaan keskiviikkona klo 2”. ehdottaa aiemmin käytettyä käännöstä ja käyttäjä todennäköisesti napsauttaa hyväksyäkseen sen. Jos uudessa asiakirjassa olisi lause “Kauppa on avoinna arkisin klo 9-5, mutta suljetaan torstaina klo 2”, ohjelmisto ehdottaa aiemmin käytettyä käännöstä ja käyttäjä korjaa tämän käännöksen ja päättää Ranskalainen sana torstaille. Jos uudessa asiakirjassa olisi lause: “Kauppa on avoinna jokaisena arkipäivänä klo 9-5, paitsi keskiviikkona, jolloin se sulkeutuu klo 2”, ohjelmisto ei katsoisi tätä sumeaksi otteluksi, vaikka merkitys olisi sama, eikä siten tarjoa lauseelle automaattista käännöstä jättäen käyttäjän kääntämään sen manuaalisesti.