Konačni transduktor
| Ovaj članak ili neka od njegovih sekcija nije dovoljno potkrijepljena izvorima (literatura, web stranice ili drugi izvori). Sporne rečenice i navodi bi mogli, ukoliko se pravilno ne označe validnim izvorima, biti obrisani i uklonjeni. Pomozite Wikipediji tako što ćete navesti validne izvore putem referenci, te nakon toga možete ukloniti ovaj šablon. |
Konačni transduktor ili konačni pretvarač je konačni automat sa dvije trake.
Uporedite ovo sa običnim konačnim automatom koji ima jednu traku. Za automat kažemo da prepoznaje niz znakova (string) ako sadržaj trake shvatimo kao ulaz. Drugim riječima, automat računa funkciju koja preslikava niz znakova u skup {0,1}. Alternativno, možemo reći da automat generiše nizove znakova, što znači da traku shvatamo kao izlaznu traku. Sa ovog gledišta, automat generiše formalni jezik, koji je formalno definisan skupom nizova znakova nad abecedom. Oba gledišta na automat su istovjetna - funkcija koju automat računa je tačno karakteristična funkcija jezika kojeg prepoznaje. Klasa jezika koje konačni automat generira jest klasa regularnih jezika.
Dvije trake transduktora se tipično gledaju kao ulazna traka i izlazna traka. Po ovom, za transduktor kažemo da transducira (ili preoblikuje) sadržaj svoje ulazne trake na izlaznu traku, prihvatanjem niza znakova na svojoj ulaznoj traci i pisanjem drugog niza na svojoj izlaznoj traci. Taj preobražaj može obaviti i nedeterministički te na taj način proizvesti više nego jedan izlaz za svaki ulazni niz. Transduktor također može i da ne proizvede izlaz za dati ulazni niz, pa u tom slučaju kažemo da ne prihvata (ili odbija) ulaz. Općenito, transduktor računa relaciju između dva formalna jezika. Klasa relacija koju računaju konačni transduktori jest klasa racionalnih relacija.
Sadržaj |
Formalna definicija [uredi]
Formalno, konačni transduktor T je šestorka (Q, Σ, Γ, I, F, δ) takva da:
- Q je konačan skup stanja;
- Σ je konačan skup ulaznih znakova (ili ulazna abeceda);
- Γ je konačan skup izlaznih znakova (ili izlazna abeceda);
- I je podskup skupa Q, skup početnih (ili inicijalnih) stanja;
- F je podskup skupa Q,skup konačnih (ili finalnih) stanja; i
(gdje je ε prazni niz) je relacija prijelaza.
Par (Q, δ) možemo shvatiti kao usmjereni graf (digraf) poznat kao graf prijelaza automata T: skup vrhova je Q, a
znači da postoji označeni (labelirani) brid iz vrha q prema vrhu r. Još kažemo da je a ulazna oznaka (ili ulazna labela) a b je izlazna oznaka (ili izlazna labela) tog brida.
Definišemo proširenu relaciju prijelaza
kao najmanji skup takav da:
;
za svaki
; i- ako
i
tada
.
Proširena relacija prijelaza jest u biti refleksivno okruženje grafa prijelaza koji je povećan na način da uzima u obzir i oznake bridova. Elementi relacije
su poznati kao putevi. Bridne oznake puta se dobiju nadovezivanjem bridnih oznaka svojih sastavnih prijelaza u redoslijedu.
Ponašanje transduktora T je racionalna relacija [T] definisana na sljedeći način:
ako i samo ako postoji
i
takvi da
. Ovime kao da kažemo da T transducira niz znakova
u niz znakova
ako postoji put od početnog do konačnog stanja čija je ulazna oznaka x i izlazna oznaka y.
Operacije nad konačnim transduktorima [uredi]
Sljedeće operacije definisane nad konačnim automatima također vrijede i za konačne transduktore:
- Unija. Za date transduktore T i S, postoji transduktor
takav da
ako i samo ako
ili
.
- Nadovezivanje (konkatenacija). Za date transduktore T i S, postoji transduktor
takav da
ako i samo ako
i
.
- Kleeneov operator. Za dati transduktor T, postoji transduktor
sa sljedećim svojstvima: (1)
; (2) ako
i
tada
; i
ne vrijedi osim ako to ne nalažu (1) ili (2).
Uočite da ne postoji operacija presjeka transduktora. Umjesto toga, postoji operacija kompozicije koja je specifična za transduktore i čija je konstrukcija slična onoj pri presjeku drugih automata. Kompozicija je definisana na sljedeći način:
- Za dati transduktor T nad abecedama Σ i Γ i transduktor S nad abecedama Γ i Δ, postoji transduktor
nad Σ i Δ takav da
ako i samo ako postoji niz znakova
takav da
i
.
Također se može napraviti projekcija neke od traka transduktora kako bi se dobio automat. Postoje dvije funkcije projekcije:
čuva ulaznu traku, i
čuva izlaznu traku. Prva projekcija,
je definisana na sljedeći način:
- Za dati transduktor T, postoji konačni automat
takav da
prihvaća x ako i samo ako postoji niz znakova y za koji
.
Druga projekcija,
je definisana na sličan način.
Dodatna svojstva konačnih transduktora [uredi]
- Odlučivo je da li je relacija [T] transduktora T prazna.
- Odlučivo je postoji li niz znakova y takav da x[T]y za dati niz znakova x.
- Neodlučivo je jesu li dva transduktora istovjetna.
Također pogledajte [uredi]
Dodatna literatura [uredi]
- Daniel Jurafsky, James H. Martin - Speech and Language Processing, Prentice Hall, 2000. ISBN 0-13-095069-6
- Galvez, Carmen; Félix Moya-Anegon (2006). An Evaluation of Conflation Accuracy Using Finite-State Transducers, vol. 62 (3), 328-349, Journal of Documentation. ISSN 0022-0418. ISSN 0022-0418.
- Galvez, Carmen (2007). Approximate Personal Name-Matching Through Finite-State Graphs, vol.58 (13), 1960-1976, Journal of The American Society for Information Science and Technology. ISSN 1532-2882. ISSN 1532-2882.
(gdje je ε prazni niz) je relacija prijelaza.
;
za svaki
; i
i
tada
.
takav da
ako i samo ako
.
takav da
ako i samo ako
i
.
sa sljedećim svojstvima: (1)
; (2) ako
i
tada
; i
ne vrijedi osim ako to ne nalažu (1) ili (2).
nad Σ i Δ takav da
ako i samo ako postoji niz znakova
.
takav da