Idi na sadržaj

Konačni transduktor

S Wikipedije, slobodne enciklopedije

Konačni transduktor ili konačni pretvarač je konačni automat sa dvije trake.

Uporedite ovo sa običnim konačnim automatom koji ima jednu traku. Za automat kažemo da prepoznaje niz znakova (string) ako sadržaj trake shvatimo kao ulaz. Drugim riječima, automat računa funkciju koja preslikava niz znakova u skup {0,1}. Alternativno, možemo reći da automat generiše nizove znakova, što znači da traku shvatamo kao izlaznu traku. Sa ovog gledišta, automat generiše formalni jezik, koji je formalno definisan skupom nizova znakova nad abecedom. Oba gledišta na automat su istovjetna - funkcija koju automat računa je tačno karakteristična funkcija jezika kojeg prepoznaje. Klasa jezika koje konačni automat generira jest klasa regularnih jezika.

Dvije trake transduktora se tipično gledaju kao ulazna traka i izlazna traka. Po ovom, za transduktor kažemo da transducira (ili preoblikuje) sadržaj svoje ulazne trake na izlaznu traku, prihvatanjem niza znakova na svojoj ulaznoj traci i pisanjem drugog niza na svojoj izlaznoj traci. Taj preobražaj može obaviti i nedeterministički te na taj način proizvesti više nego jedan izlaz za svaki ulazni niz. Transduktor također može i da ne proizvede izlaz za dati ulazni niz, pa u tom slučaju kažemo da ne prihvata (ili odbija) ulaz. Općenito, transduktor računa relaciju između dva formalna jezika. Klasa relacija koju računaju konačni transduktori jest klasa racionalnih relacija.

Formalna definicija

[uredi | uredi izvor]

Formalno, konačni transduktor T je šestorka (Q, Σ, Γ, I, F, δ) takva da:

  • Q je konačan skup stanja;
  • Σ je konačan skup ulaznih znakova (ili ulazna abeceda);
  • Γ je konačan skup izlaznih znakova (ili izlazna abeceda);
  • I je podskup skupa Q, skup početnih (ili inicijalnih) stanja;
  • F je podskup skupa Q,skup konačnih (ili finalnih) stanja; i
  • (gdje je ε prazni niz) je relacija prijelaza.

Par (Q, δ) možemo shvatiti kao usmjereni graf (digraf) poznat kao graf prijelaza automata T: skup vrhova je Q, a znači da postoji označeni (labelirani) brid iz vrha q prema vrhu r. Još kažemo da je a ulazna oznaka (ili ulazna labela) a b je izlazna oznaka (ili izlazna labela) tog brida.

Definišemo proširenu relaciju prijelaza kao najmanji skup takav da:

  • ;
  • za svaki ; i
  • ako i tada .

Proširena relacija prijelaza jest u biti refleksivno okruženje grafa prijelaza koji je povećan na način da uzima u obzir i oznake bridova. Elementi relacije su poznati kao putevi. Bridne oznake puta se dobiju nadovezivanjem bridnih oznaka svojih sastavnih prijelaza u redoslijedu.

Ponašanje transduktora T je racionalna relacija [T] definisana na sljedeći način: ako i samo ako postoji i takvi da . Ovime kao da kažemo da T transducira niz znakova u niz znakova ako postoji put od početnog do konačnog stanja čija je ulazna oznaka x i izlazna oznaka y.

Operacije nad konačnim transduktorima

[uredi | uredi izvor]

Sljedeće operacije definisane nad konačnim automatima također vrijede i za konačne transduktore:

  • Unija. Za date transduktore T i S, postoji transduktor takav da ako i samo ako ili .
  • Nadovezivanje (konkatenacija). Za date transduktore T i S, postoji transduktor takav da ako i samo ako i .
  • Kleeneov operator. Za dati transduktor T, postoji transduktor sa sljedećim svojstvima: (1) ; (2) ako i tada ; i ne vrijedi osim ako to ne nalažu (1) ili (2).

Uočite da ne postoji operacija presjeka transduktora. Umjesto toga, postoji operacija kompozicije koja je specifična za transduktore i čija je konstrukcija slična onoj pri presjeku drugih automata. Kompozicija je definisana na sljedeći način:

  • Za dati transduktor T nad abecedama Σ i Γ i transduktor S nad abecedama Γ i Δ, postoji transduktor nad Σ i Δ takav da ako i samo ako postoji niz znakova takav da i .

Također se može napraviti projekcija neke od traka transduktora kako bi se dobio automat. Postoje dvije funkcije projekcije:

čuva ulaznu traku, i čuva izlaznu traku. Prva projekcija, je definisana na sljedeći način:

  • Za dati transduktor T, postoji konačni automat takav da prihvaća x ako i samo ako postoji niz znakova y za koji .

Druga projekcija, je definisana na sličan način.

Dodatna svojstva konačnih transduktora

[uredi | uredi izvor]
  • Odlučivo je da li je relacija [T] transduktora T prazna.
  • Odlučivo je postoji li niz znakova y takav da x[T]y za dati niz znakova x.
  • Neodlučivo je jesu li dva transduktora istovjetna.

Također pogledajte

[uredi | uredi izvor]

Dodatna literatura

[uredi | uredi izvor]
  • Daniel Jurafsky, James H. Martin - Speech and Language Processing, Prentice Hall, 2000. ISBN 0-13-095069-6
  • Galvez, Carmen (2006). An Evaluation of Conflation Accuracy Using Finite-State Transducers. Journal of Documentation. str. vol. 62 (3), 328–349. ISSN 0022-0418. Nepoznati parametar |coauthors= zanemaren (prijedlog zamjene: |author=) (pomoć); CS1 održavanje: nepreporučeni parametar (link)
  • Galvez, Carmen (2007). Approximate Personal Name-Matching Through Finite-State Graphs. Journal of The American Society for Information Science and Technology. str. vol.58 (13), 1960–1976. ISSN 1532-2882. CS1 održavanje: nepreporučeni parametar (link)

Vanjski linkovi

[uredi | uredi izvor]