Nitqin tanınmasının tarixi haqqında qısa məlumat

Nitqin tanınması insan danışığının avtomatik olaraq kompüter proqramları vasitəsilə yazıya çevrilməsidir. Bu sahədə əsas nailiyyətlərin son zamanlarda əldə olunmasına baxmayaraq nitqin tanınmasının tarixi 1950-ci illərə qədər uzanır. Aşağıda bu texnologiyanın son 70 ildə keçdiyi yola qısa nəzər salacağıq.
İlk nitqin tanınması sistemi sözlərin deyil rəqəmlərin tanınmasına fokuslanmışdır. 1952-ci ildə Bell Laboratoriyasında "Audrey" adlı sistem quruldu. Bu sistem yalnız rəqəmləri tanıyırdı, əlavə olaraq rəqəmlər yüksək səslə və bir-bir deyilməli idi. Yəni sistem kifayət qədər bəsit idi. 10 ildən sonra IBM firmasının qurduğu "Shoebox" adlı sistem artıq İngilis dilində 16 sözü tanıyırdı. Altmışıncı illərdə dünyanın bir çox yerində bu texnologiyanın yaradılması yolunda əhəmiyyətli addımlar atılmağa başlanmışdır. 70-cı illərdə ABŞ Müdafiə Departamenti və DARPA-nın öncüllüyündə texnologiya bir növbəti inkişaf mərhələsinə qədəm qoydu. Onların SUR proyekti nitqin tanınması sahəsində ən böyüklərdən idi. Bu proyektdən çıxan "Harpy" nitqin tanınması  sistemi 1000-dən çox sözü tanıya bilirdi. 80-lərdə Gizli Markov Modelləri (HMM) statistik alqoritmlərin tətbiqi inkişafı yeni mərhələyə daşıdı. HMM artıq əvvəlcədən bəlli olan söz qəliblərini deyil, naməlum olan səsin söz olma ehtimalını axtarırıdı.
90-larda fərdi kompüterlərin inkişafı, hesablama gücünün artması Dragon Dictate kimi proqramların hər kəs tərəfindən istifadəsini reallığa çevirdi. 2001-ci ildə nitqin tanınması sisteminin keyfiyyəti 80% idi. Bu illərdə Google firması Google Səsli Axtarış sistemini çıxarana qədər böyük yeniliklər olmadı. Çünki bu mobil tətbiq idi və artıq texnologiya milyonlarla insanın əlində idi. Digər tərəfdən sistem internet üzərindən işləyirdi, yəni hesablama data mərkəzlərə daşınmışdı.
2011-ci ildə Apple firması Google-un Səsli Axtarış sisteminə bənzər Siri adlı səsli köməkçini təqdim etdi. Elə Amazon Alexa da o dövrlərin məhsulu idi. Və artıq insanlar qurğularla daha rahat şəkildə ünsiyyətdə olmağa başladılar. Bu illərdə digər bir mühüm addım neyron şəbəkələr - dərin öyrənmə alqoritmlərinin bu sahəyə tətbiqi oldu. HMM yanaşma ilə birgə istifadə olunan (hibrid) dərin öyrənmə alqoritmləri sistemin keyfiyyətinin əhəmiyyətli dərəcədə artmasına səbəb oldu.
Bu gün Google, Amazon, IBM, Microsoft kimi böyük firmalar nitqin tanınması sahəsində güclü rəqabət içindədirlər.
Voicen də bu sahədə fəaliyyət göstərən yüksək texnologiya şirkətidir. Şirkətin dərin öyrənmə alqoritmlərini tətbiq etməklə əldə etdiyi nəticələr böyük rəqiblərlə rəqabət edəcək səviyyədədir.