Καινοτομία, Έρευνα & Τεχνολογία, τ. 05 - page 25

Κ Α Ι Ν Ο Τ Ο Μ Ι Α
Ν Ε ΕΣ ΤΕΧΝΟΛΟΓΊΕΣ
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓ ΙΑ
Ερευνητικά αποτελέσματ από τη συμμετοχή
του Εργαστηρίου Ενσύρματης Τηλεπικοινωνίας του Πανεπιστημίου Πατρών
σε ευρωπαϊκά προγράμματτην τελευταία δεκαετία.
Το Εργαστήριο Ενσύρματης
Τηλεπικοινωνίας (ΕΕΤ) του Τμήματος
Ηλεκτρολόγων Μηχανικών και Τεχνολογίας
Υπολογιστών του Πανεπιστημίου Πατρών
συμπλήρωσε πρόσφατα 10 χρόνια
συμμετοχής σε ερευνητικά και
εκπαιδευτικά προγράμματα της
Ευρωπαϊκής Ένωσης στην περιοχή
Γλωσσικής Τεχνολογίας (Επεξεργασία
ομιλίας και φυσικής γλώσσας σε
υπολογιστή με εφαρμογές). Με την
ευκαιρία αυτή παρουσιάζονται συνοπτικά
τα σημαντικότερα από τα προγράμματα στα
οποία συμμετέσχ ε μαζί με τα
αποτελέσματα τους τόσο συνολικά σε
επίπεδο προγράμματος, όσο και ειδικά για
την ελληνική γλωσσά.
Το ΕΕΤ εργάζεται στην περιοχή Γλωσσικής
Τεχνολογίας με οργανωμένες ερευνητικές
ομάδες, παράλληλα με τη δραστηριότητα
του στην περιοχή Τηλεπικοινωνιών και
στην περιοχή Τεχνολογίας Ήχου.
Του Καθηγητή Γ. Κοκκινάκη
Διευθυντή Εργαστηρίου Ενσύρματης
Τηλεπικοινωνίας Πανεπιστημίου Πατρών
1) Πρόγραμμα: ESPRIT 291/860 -
Γλωσσολογική Ανάλυση Ευρωπαϊκών
Γλωσσών (Linguistic Analysis of the
European Languages)
Διάρκεια:
4 έτη (1985-1989 )
Προϋπολογισμός: 8,6 kECU
Εταίροι:
OLIVETT I (Ι). Συντονιστής. ACORN
COMPUTERS (GB), CSATA (I), LIMSI-
CNRS (F). NIJMEGEN UNIVERSIT Y (NL),
PATRAS UNIVERSIT Y (GR), RUHR
UNIVERSITY
BOCHUM (D). UNED (E)
Στόχος:
Ανάλυση σε υπολογιστή 7 ευρωπαϊκών
γλωσσών (αγγλικής, γαλλικής, γερμανι­
κής, ελληνικής, ισπανικής, ιταλικής, ολ­
λανδικής) με κοινή στρατηγική και μεθο­
δολογία και ανάπτυξη υπολογιστικών ερ­
γαλείων και βάσεων δεδομένων με τυπο­
ποιημένη μορφή, ώστε να είναι εύκολη η
χρησιμοποίηση τους στις διαφορετικές
γλώσσες .
Αποτελέσματα:
• Δημιουργία βάσεως δεδομένων με συλ­
λογή ομοειδών κειμένων 300.00 0 λέξε­
ων σε κάθε γλώσσα, αναλυμένων σύμ­
φωνα με κοινό σύστημα γραμματικών
κατηγοριών.
• Ανάπτυξη λογισμικού για αυτόματη με­
τατροπή ορθογραφικού κειμένου σε
φωνητική γραφή (Gr -> Ph) με χρήση
του διεθνούς φωνητικού αλφάβητου
προσαρμοσμένου στα σύμβολα του υ­
πολογιστή.
• Εφαρμογή του ανωτέρου στη συλλογ ή
κειμένων και διόρθωση των σφαλμάτων.
• Εξαγωγή στατιστικών αποτελεσμάτων
από την ορθογραφική και φωνητική
μορφή της συλλογής κειμένων.
• Ανάπτυξη "μοντέλου γλώσσας" στηρι­
ζόμενου σε μοντέλο Markov δεύτερης
τάξης των γραμματικών κατηγοριών για
την αντιμετώπιση πολυσημίας σε συ­
στήματα αναγνώρισης ομιλίας, κλπ.
• Ανάλυση του προβλήματος μετατροπής
κειμένου από φωνητική σε ορθογραφι­
κή μορφή (Ph ->Gr).
Ειδικά για την ελληνική γλώσσα
πραγματοποιήθηκε:
• Επαυξημένη συλλογή κειμένων 500.00 0
λέξεων, λεπτομερειακά αναλυμένων με
σύστημα 260 γραμματικών κατηγοριών.
• Αυτόματο σύστημα γραμματικής ανάλυ­
σης κειμένου.
• Λογισμικό Gr -> Ph με αξιοπιστία μεγα­
λύτερη του 98.5%.
• Εκτεταμένη στατιστική ανάλυση της ορ­
θογραφικής και φωνητικής μορφής της
συλλογής κειμένων.
• Σύστημα Ph -> Gr στηριζόμενο σε μο­
ντέλα Markov, ως συνέχεια της ανάλυ­
σης Ph -> Gr στα πλαίσια του προγράμ­
ματος.
2) Πρόγραμμα:
ESPRIT 2104, POLYGLOT:
Πολύγλωσσο Σύστημα Μετατροπής
Κειμένου σε Ομιλία και Ομιλίας
σε Κείμενο (A Multilingual System
for Text-to-Speech and Speech-to-
Text).
Διάρκεια:
3 έτη (1989-1992 )
Προϋπολογισμός: 16,5 kECU
Εταίροι:
OLIVETTI (Ι) Συντονιστής, LIMSI-CNRS (F),
RUHR UNIVERSITY BOCHUM (D),
NIJMEGEN UNIVERSITY (NL),
PATRAS UNIVERSITY (GR. SYNTAX (I),
BULL (F),
IPO
(NL), PHILIPS (D),
TRIUMPH-ADLER (D). TECHNICAL
UNIVERSITY OF MADRID (E). CSTR (GB).
CRAI (I).
Στόχος:
Ανάπτυξη συστήματος σύνθεσης ομιλίας
από κείμενο και αναγνώρισης ομιλίας με­
γάλου λεξιλογίου για 7 ευρωπαϊκές γλώσ­
σες (αγγλική, γαλλική, γερμανική, ελληνι­
κή, ισπανική, ιταλική, ολλανδική), με χρη­
σιμοποίηση κοινής αρχιτεκτονικής, φιλο­
σοφίας, ανάλυσης και αναπτυξιακών ερ­
γαλείων.
1...,15,16,17,18,19,20,21,22,23,24 26,27,28,29,30,31,32,33,34,35,...68
Powered by FlippingBook