Κ Α Ι Ν Ο Τ Ο Μ Ι Α
Ν Ε ΕΣ ΤΕΧΝΟΛΟΓΊΕΣ
Αποτελέσματα:
• Εξελιγμένο πολύγλωσσο σύστημα σύν
θεσης ομιλίας από κείμενο.
• Πολύγλωσσο σύστημα αναγνώρισης ο
μιλίας σε PC 2000 μεμονωμένων λέξε
ων, επεκτάσιμο σε πολύ μεγάλο λεξιλό
γιο και προσαρμοζόμενο στον ομιλητή.
• Επιλεγμένες εφαρμογές των ανωτέρω
σε υπαγόρευση ιατρικών εκθέσεων, σε
περιβάλλον PC-Windows, σε email και
σε εκπαιδευτικά βοηθήματα.
• Ανάπτυξη και ανάλυση των αναγκαίων
βάσεων δεδομένων για τα ανωτέρω.
• Ανάλυση και σύγκριση τριών διαφορετι
κών μεθόδων ανάπτυξης συστημάτων
συνεχούς αναγνώρισης ομιλίας σε PC.
Ειδικά για την ελληνική γλώσσα
πραγματοποιήθηκε:
• Σύστημα σύνθεσης ομιλίας από κείμενο
πραγματικού χρόνου και απεριόριστου
λεξιλογίου με υψηλή καταληπτότητα και
ικανοποιητική φυσικότητα ομιλίας.
• Το σύστημα βασίζεται σε σύνθεση φω
νημάτων με σειριακό/παράλληλο συνθέ
τη Formants, περιλαμβάνει εξελιγμένο
επεξεργαστή κειμένου για το χειρισμό
συμβόλων, συντμήσεων, αριθμών, κλπ.
Και εξάγει καμπύλες προσωδίας σε επί
πεδο πρότασης με βάση συντακτική α
νάλυση και τα σημεία στίξης.
• Σύστημα αναγνώρισης ομιλίας 8,000 με
μονωμένων λέξεων, επεκτάσιμο.
• Σύστημα αναγνώρισης συνεχούς ομι
λίας 1,000 λέξεων, σε συνέχεια της ανά
λυσης μεθόδων αναγνώρισης συνεχούς
ομιλίας που αναφέρθηκε ανωτέρω.
• Εφαρμογή σύνθεσης ομιλίας από κείμε
νο σε συνδυασμό με ηχογραφημένη ο
μιλία στην εκμάθηση ξένων γλωσσών
(Σύστημα ΣΩΚΡΑΤΗΣ) .
3) Πρόγραμμα:
ESPRIT 6819 (SAM-Α): Αξιολόγηση
Τεχνολογίας Ομιλίας σε
πολυγλωσσικές εφαρμογές (Speech
Technology Assessment in Multi
lingual Applications), συνέχεια του
προγράμματος ESPRIT 2589 (SAM):
Πολύγλωσση Αξιολόγηση,
Μεθοδολογία και Τυποποίηση
εισαγόμενης και εξαγόμενης
ομιλίας (Multi-lingual Speech
Input/Output Assessment,
Methodology and Standardization)
(1989-1992).
Διάρκεια:
2 έτη (1992-1994)
Προϋπολογισμός: 1,48 kECU
Εταίροι:
LOGICA (GB), Συντονιστής, CSELT (I),
DRA (GB), ENST (F), FUB (I), ICP (F),
IDIAP (CH), INESC (P), JTAS (DK),
RUB (D), TNO (NL), Televerket (CH),
UCL (GB), UPATRAS
(GR), UPC (E), VECSY S (F).
Στόχος:
Ο ορισμός, καθιέρωση και εξάπλωση προ
διαγραφών ανάπτυξης και αξιολόγησης
συστημάτων στην περιοχή τεχνολογίας ο
μιλίας και φυσικής γλώσσας.
Αποτελέσματα:
Δημιουργία βάσεων δεδομένων προφορι
κού λόγου για όλες τις γλώσσες που συμ
μετείχαν στο πρόγραμμα.
Ειδικά για την ελληνική γλώσσα αναπτύ
χθηκε βάση δεδομένων προφορικού λό
γου (corpus) αποτελούμενη από:
• Συστηματικά επιλεγμένους συνδυα
σμούς φωνημάτων CVC (C: σύμφωνο,
V: φωνήεν) προφερόμενους μεμονωμέ
να και σε λέξεις με καθορισμένο προη
γούμενο και επόμενο περιβάλλον
(context).
• Επιλεγμένους αριθμούς από 0-999, έτσι
ώστε να καλύπτονται όλες οι φωνοτα-
κτικές δυνατότητες του ελληνικού συ
στήματος αρίθμησης.
• Βραχείες παραγράφους με πέντε θεμα
τικά συνδεόμενες προτάσεις.
• Προτάσεις που κατασκευάστηκαν για
να αντισταθμίσουν την ανισορροπία στη
συχνότητα εμφάνισης φωνημάτων στις
θεματικές κατηγορίες.
Διαφορετικά τμήματα και μεγέθη του ανω
τέρου υλικού ηχογραφήθηκαν από ομά
δες ομιλητών αποτελούμενες από έναν
άνδρα και μία γυναίκα μέχρι 30 άνδρες και
30 γυναίκες.
4) Πρόγραμμα:
ESPRIT Basic Research - ELSNET:
Ευρωπαϊκό Δίκτυο Εξαιρετικής
Επίδοσης στη Γλώσσα
και Ομιλία (European Network
of Excellence in Language
and Speech)
Διάρκεια:
1992 - συνεχίζεται
Εταίροι:
29 Ευρωπαϊκά Πανεπιστημιακά Εργαστή
ρια και Ερευνητικά Κέντρα με αξιόλογη ε
ρευνητική δραστηριότητα στην περιοχή ε
πεξεργασίας γραπτού και προφορικού λό
γου.
Στόχος:
Ο συντονισμός της ευρωπαϊκής έρευνας
και δραστηριοτήτων μεταπτυχιακής εκπαί
δευσης, που προάγουν την ανάπτυξη της
τεχνολογίας ομιλίας και φυσικής γλώσ
σας.
Αποτελέσματα:
Πραγματοποίηση σειράς ερευνητικών συ
νεργασιών και ανταλλαγών επιστημόνων
μεταξύ των εταίρων.
Ειδικά, το Εργαστήριο Ενσύρματης Τηλε
πικοινωνίας συμμετέσχε σε δύο προγράμ
ματα HCM (Human Capital and Mobility)
της EE τα οποία πραγματοποιήθηκαν μέ
σω του ELSNET .
5) Πρόγραμμα: LRE-61004,
ONOMASTICA: Πολύγλωσσο Λεξικό
Προφοράς Κυρίων Ονομάτων και
Τοπωνυμιών (Multi-language
Pronunciation Dictionary of Proper
Names and Place Names).
Διάρκεια:
2.5 έτη (1993-1995)
Προϋπολογισμός: 3,63 kECU
Εταίροι:
UNIVERSIT Y OF EDINBURGH (GB), Συν
τονιστής,
UNIVERSIT Y OF AALBORG (D), ENST (F),
UNIVERSIT Y OF BERLIN (D), UNIVERSIT Y
OF PATRAS (GR).UNIVERSIT Y OF PISA
(I), TECHNICAL UNIVERSIT Y OF MADRID
(E), INESC (PR), NIJMEGEN UNIVERSIT Y
(NL) SINTEF DELAB (NW), KTH (SD), + 11
ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΟ Ι ΟΡΓΑΝΙΣΜΟΙ.
Στόχος:
Η καταγραφή της προφοράς ονομάτων
που περιέχονται στους τηλεφωνικούς κα
ταλόγους των 11 χωρών που έλαβαν μέ
ρος στο πρόγραμμα και επιπλέον της προ-