Beszédkutatás 2009 PDF Nyomtatás E-mail
Hírek
Írta: Markó Alexandra   
2009. október 08. csütörtök, 14:31

A Spontánbeszéd-kutató műhely tagjai legújabb kutatási eredményeiket a Beszédkutatás 2009 konferencián mutatták be 2009. október 16-án és 17-én az MTA Nyelvtudományi Intézetében.

A műhelytagok előadásai: 

Gósy Mária: Szóvariációk a spontán beszédben

A spontán beszéd bonyololult tervezési mechanizmus eredménye. A gondolatok nyelvi megformálása csaknem egyidejű a meghangosításukkal, s ennek sokféle következménye van a kiejtésre vonatkozóan. Az artikuláció kevésbé kontrollált, jelentős a kontextushatás, és mindez több akusztikai fonetikai paraméterben is tetten érhető. Korábbi vizsgálatok a beszédhangok időtartamának és egyes formánsainak variabilitását vizsgálták a magyarban, illetve egy-egy kutatás az olvasás és a spontán narratívák közötti különbségek bemutatására irányult. A spontán beszédben ejtett azonos szavak akusztikai fonetikai sajátosságainak elemzésével még nem foglalkoztak. A jelen kutatás célja egy gyakori szó beszélőn belüli és beszélők közötti variációinak bemutatása, amelyek – hipotézisünk szerint – egyfajta akusztikai fonetikai mezőt alkotnak. A kísérlethez a BEA spontánbeszéd-adatbázis anyagát használtuk föl. A leggyakrabban előforduló szavak közül az akkort választottuk ki, amelynek a teljes időtartamát, a szót alkotó beszédhangok időtartamát, a zöngekezdési időt, a magánhangzók első két formánsát és a mássalhangzók akusztikai szerkezetét elemeztük. A kutatás eredményei megerősítették azt, hogy a beszélők bizonyos mértékig kontrollálják ugyan az artikulációs gesztusaikat, mégis igen változatosak a szórealizációk akusztikai fonetikai megvalósulásai. Bizonyos invariáns jegyek megőrződnek, lehetővé téve a (majdnem) biztos lexikális hozzáférést. Az ugyanazon adatközlő spontán beszédében előforduló akkor szavak a feltételezettnél jóval nagyobb változatosságot mutatnak.

Mády Katalin: Szakaszhatárok percepciója spontán beszédben

A beszédben háromféle szakaszhatárt szokás megkülönböztetni: gyenge határt, amelyet szakaszvégi nyújtás és sajátos hanglejtés jellemez, erős határt, amelyet a fentieken kívül szünet is követ, valamint rendkívüli (pl. megakadás miatt létrejött) határokat. 20 személlyel végzett percepciós kísérletünk alapján a következő, a fentiektől részben eltérő jellemzőket kaptuk: (1) Szakaszvégi nyújtás csak esetenként volt jelen gyenge határok előtt. (2) Ha a következő szakasz első szótagjának alapfrekvenciája magasabb volt a szakaszzáró szótagénál, gyakoribb volt az erős határ észlelése, ha pedig alacsonyabb, az többnyire megakadás érzetével párosult. A gyenge határokat nem jellemezte f0-változás. (3) A szünetek 40–40%-ban társultak erős határ, ill. megakadás észleléséhez, 20%-ban gyenge határéhoz. Az automatikusan felismerhető jellemzők támpontot adhatnak a kézi címkézéshez is.

Markó Alexandra: Prozódiai határjelzés a spontán beszédben (?)

Korábbi, magyar spontánbeszéd-anyagon végzett vizsgálatok kimutatták, hogy a prozódiai tényezők határjelző funkciója viszonylagos, több szupraszegmentális jegy együtt járása is (értelemszerűen) csak akkor bír tagoló szereppel, ha a szöveg szemantikai-szintaktikai szerveződése ezt megerősíti (vö. Gósy 2003, Váradi 2008). A jelen kutatásban azt vizsgáljuk, hogy a különböző prozódiai tényezők milyen paraméterek esetén és milyen hatásfokkal váltják ki a hallgatóban a befejezettség érzetét. Az elemzéshez a BEA 10 (különböző korú és nemű) adatközlőjének 3-4 perces spontán szövegét használjuk fel. Háromféle tesztben kérünk az adatközlőktől a szövegbeli határokra vonatkozó ítéleteket: 1. egy percepciós kísérletben a szövegeket akusztikailag megszűrve játsszuk le (a jelet 0–500 Hz-es tartományban engedjük át); 2. egy másik tesztcsoport ugyanezeknek a szövegeknek a lejegyzett változatában jelöli be a mondathatárokat – a hanganyag ismerete nélkül; 3. a harmadik csoport az eredeti, szűretlen hangfelvétel alapján jelöl határokat a lejegyzett szövegben. A teszteredmények nyomán akusztikai elemzést végzünk a szövegekben jelölt határpontokon. Megvizsgáljuk a szupraszegmentális jegyek (és konkomitanciáik) határjelző funkcióját, és feltárjuk ezek hierarchiáját. Az eredmények adatokat szolgáltatnak a humán – és esetlegesen nyelvspecifikus – feldolgozásról, valamint felhasználhatók lehetnek a mesterséges beszédfelismerés számára is.

Beke András – Horváth Viktória: Nazális a szomszédom

A nazalizált magánhangzók realizációja a koartikulációnak egy sajátos területe, mivel képzésükkor egyszerre nyitott az orr-és a szájüreg. A nazalizáció továbbá nagymértékben egyénfüggő, ezért fontos akusztikai paraméter lehet a kriminalisztikai fonetikában a beszélő személy azonosításának. A jelen kutatás célja a bilabiális és az alveoláris nazális mássalhangzók hatásának vizsgálata a leggyakoribb magánhangzók (a, o, i, e) akusztikai szerkezetére a magyar spontán beszédben elsőként. Hipotéziseink szerint a magánhangzók eltérő mértékben nazalizálódnak a magánhangzó és a nazális minőségétől, a fonetikai pozíciótól, illetve a beszélő személytől függően. A BEA adatbázis 20 beszélőjének spontán beszédét annotáltuk, az akusztikai elemzéseket a Praat és a MATLAB szoftverekkel végeztük, a statisztikai elemzések az SPSS programmal történtek. Az eredmények választ adnak arra a kérdésre, hogy a nazalizáció milyen akusztikai paraméterekben ragadható meg.

Bárkányi Zsuzsanna – Kiss Zoltán – Mády Katalin: Az sz-z oppozíció fenntartása megnyilatkozás végén

Korábbi kutatásaink során megmutattuk, hogy a magyar v kétarcú fonológiai viselkedését aerodinamikai alapokon magyarázhatjuk, mert a zönge és a zörej egyidejű fenntartása kedvezőtlen hangkörnyezetben nem,vagy csak részben valósul meg. Az aerodinamikai modellünk azt jósolja, hogy a zönge- és a zörejcélpontok közötti lényegi ellentmondás mindenzöngés réshang esetében fennáll. Ebben a tanulmányban azt mutatjuk be – öt beszélő által felolvasott szöveg alapján –, hogy a v-hez hasonlóan, megnyilatkozás végén a magyar z is (részben) elveszti zöngésségét. Az sz és z közötti fonológiai kontraszt azonban más fonetikai kulcsoknakköszönhetően (frikatíva hossza, előző magánhangzó hossza, zöngés szakasz aránya, zörejesség) mégsem tűnik el. A vizsgálat arra is választ keres, hogy zöngésségi hasonulás szempontjából mégis miért"erősebb" a z, mint a v (a z zöngésít, míg a v nem), és ez hogyan ragadható meg egy fonetikai alapú fonológiai keretben.

Bóna Judit: Az idős életkor tükröződése a magánhangzók ejtésében

Az életkor előrehaladtával beszédünk változik: egyrészt a szervezet természetes elhasználódása, a beszédszervek elöregedése, másrészt a konzervatívabb ejtési mód befolyásolják az időskori beszéd akusztikai paramétereit. A beszéd tempója lassabb lesz, változnak az alaphangmagasság (a férfiaké nő, a nőké csökken) és a szünettartás; a zöngeképzés tisztasága; illetve a szegmentális szint spektrális jellemzői. Angol anyanyelvűekkel végzett kísérletek azt mutatják, hogy az angolban az F1 minden magánhangzónál, az F2 pedig egyes magánhangzóknál szignifikánsan változik. A magyarra vonatkozóan azonban nincsenek pontos adataink arról, hogy milyen különbségek vannak a szegmentális szerkezetben az időskorú és a fiatal beszélőknél. A jelen tanulmányunk célja annak meghatározása, hogy hogyan változik a magánhangzók akusztikai szerkezete az időskori beszédben; kimutathatók-e az angolhoz hasonló változások a magyarban is, és ha igen, mely akusztikai paraméterekben jelennek meg. Kutatásunkhoz a BEA 60 évnél idősebb beszélőinek spontán narratíváit elemeztük és vetettük össze nemben illesztett 40 év alatti beszélők beszédével. A beszédprodukciókban meghatároztuk a beszédtempót és az artikulációs tempót, megmértük a magánhangzók időtartamait, az F1- és F2-értékeket; illetve a zöngeképzés tisztaságát (jel/zaj viszonyt). Hipotéziseink szerint a vizsgált paraméterek mindegyike mutat változást az életkor előrehaladtával. Eredményeink közvetve felhasználhatók a klinikai nyelvészetben, illetve a beszédszintézisben és a kriminalisztikai fonetikában is.

Tarján Balázs – Mihajlik Péter – Tüske Zoltán – Fegyó Tibor: Különbségek a spontán és a tervezett magyar nyelvű beszéd gépi felismerésében

Az előadás bemutatja a BME-TMIT és AITIA International kooperációban készült legújabb nagyszótáras folyamatos magyar nyelvű beszédfelismerési eredményeket. A felismerendő beszéd spontaneitási fokának megfelelően több alkalmazást ismertetünk és jellemezünk akusztikai-nyelvi szempontok szerint. A beszédfelismerés pontosságát alkalmazásonként számos paraméter függvényében vizsgáljuk. Kiemelt figyelmet szentelünk a spontaneitás és a morfológia kapcsolatának; megmutatjuk, hogy a spontaneitás nem csupán az artikulációt befolyásolhatja jelentősen, de az alaktani változatosságot is. Megmutatjuk, hogy a morfológiai változatosság kezelése szó helyett morfémaszerű lexikai egységek használatával minden vizsgált esetben felismerési hibacsökkenéssel jár, de az alkalmazástól jelentősen függő mértékben. Hipotézisünk, hogy ez a hibacsökkenés a felismerendő beszéd tervezettségének fokával korrelál.

Dér Csilla Ilona: „Töltelékelem” vagy új nyelvi változó?

Beszédtervezési funkciók esetében feltételezhető, hogy az adott nyelvi egység véletlenszerűen fog a társalgás során felbukkanni, míg ha valamiféle szisztematikusság jelentkezik az előfordulásában (pl. gyakrabban tűnik fel egyes szerkezetek előtt), akkor más szerepe is lehet, akár egy új nyelvi változó megjelenését is tükrözheti (Tagliamonte 2005). Mint egy korábbi, a spontán beszélt nyelvre vonatkozó vizsgálat (Dér–Markó 2007) rámutatott, a hát mellett az így, az ilyen és az úgyhogy is igen gyakori diskurzusjelölő a magyarban. Ám míg az előbbi funkciói viszonylag jól megadhatók, kérdés, hogy mi a helyzet a másik három elem esetében. Vizsgálatomban, melynek anyagát a BEA adatbázis húsz, 20 és 70 év közötti adatközlőjének csaknem 4 órányi spontán beszéde képezi, az említett elemek előfordulási gyakoriságát és megjelenési pozícióját vizsgálva igyekszem választ kapni arra a kérdésre, hogy vajon „csak” beszédtervezési feladatok ellátására valók, vagy más lehetséges funkciójuk is van.

Beke András – Szaszák György: Semleges magánhangzók automatikus felismerése spontán beszédben

A spontán beszédben előforduló magánhangzók a lazább artikuláció miatt semlegesedhetnek. A hazai és a nemzetközi szakirodalom szerint az alaprealizáció és a svá realizáció általában elkülöníthető a magánhangzó első két formánsa alapján. Előzetes kutatásaink szerint a magyar magánhangzók második formánsa különíti el legjobban a magánhangzót és semleges realizációját. A jelen kutatásban a magánhangzó alap- és svárealizációinak felismerését teszteltük különböző fonémákkal. A vizsgálatban a BEA-adatbázis 80 beszélőjéből 8 férfi és 12 nő spontán beszédét hangszinten manuálisan annotáltuk. A neutralizálódás megállapításához a korábbi vizsgálatokból ismert klaszterközéppontokat használtuk (Beke-Gráczi 2009), illetve hallás alapján ellenőriztük azokat. A beszédhangokból készült MFCC-kből kinyertük a hangra jellemző kepsztrális tulajdonságokat (429 db). A csoportosításhoz rejtett Markov-modellt használtunk HTK környezetben. A tanításra kétféle osztályozást alkalmaztunk: a) az elemzett magánhangzók, illetve az összes svá osztálya, b) az összes magánhangzók, illetve a fonémáiknak megfelelő svák osztálya. Hipotézisünk szerint, ha a svákat alaprealizációjuktól függően külön osztályokba sorolva tanítjuk be a rendszert, akkor a felismerési arány növekszik. A vizsgálat eredményei hozzájárulnak a magánhangzók realizációnak megismeréséhez, és felhasználhatók a beszédszintézis, illetve a beszédfelismerés területén.

Csapó Tamás Gábor – Gráczi Tekla Etelka – Bárkányi Zsuzsanna – Beke András – Bőhm Tamás: A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

A nemzetközi szakirodalom alapján a szubglottális rezonanciák a magánhangzókat kategorikusan természetes osztályokra tagolják. Korábbi magyar nyelvre történő kutatásunkban ezt részben igazoltuk. A jelen kutatásban azt vizsgáltuk, hogy a spontán beszédben milyen mértékű a szubglottális rezonanciák osztályozási képessége. Azt várjuk, hogy a) a szubglottális rezonancia elválasztó szerepe a spontán beszédben a semleges realizációk megjelenése miatt kisebb mértékű; b) azonban a percepció számára az adott magánhangzóhoz sorolható megvalósulások logatomolvasáshoz hasonló mértékűek. A hipotéziseink ellenőrzésére egy kísérletsorozatot terveztünk, amelyben 6 beszélő spontán beszédét és logatomolvasását akusztikailag elemeztük. Az eredményeket egy percepciós tesztben ellenőriztük. Az eredmények a beszélőazonosítás, beszédfelismerés és beszédszintézis területéhez járulhatnak hozzá.

Imre Angéla Bóna Judit: Szociolingvisztikai tényezők a felnőttek hangos olvasásban

A hétköznapi életben gyakran előfordulhat, hogy valamit hangosan fel kell olvasnunk. A hangos olvasás árulkodik arról, hogy mennyire tudunk folyékonyan olvasni, gyakorlott olvasók/felolvasók vagyunk-e, illetve képesek vagyunk-e értelmezni, és értelmezve meghangosítani egy szöveget.

A magyar anyanyelvű felnőttek körében tudomásunk szerint még nem végeztek a hangos olvasást vizsgáló felmérést. A jelen kutatás a BEA (magyar Beszélt Nyelvi Adatbázis) segítségével felnőttek hangos olvasását elemzi. A vizsgálat 30 férfi és 30 nő részvételével készült, életkoruk 20–76 év. A résztvevőknek ugyanazt a rövid szöveget kellett hangosan felolvasniuk, miután némán átolvashatták a szöveget. A rögzített felolvasásokban elemeztük a megakadásokat (olvasási hibákat), a beszéd- és artikulációs tempót, a szünetek helyét és időtartamát, a hangsúlyok és a beszéddallam megvalósulását, illetve azt, hogy mennyire volt értő-értető a felolvasás.

Eredményeinkkel képet kaphatunk arról, hogy milyen tipikus hibákat ejtenek a hangos olvasás során a felnőttek, illetve megvizsgálhatjuk, hogy maga az olvasás (a dekódolás), a szöveg meghangosítása (adekvát kiejtés) vagy az értelmezés okozza a nehézséget számukra.

Gráczi Tekla Etelka – Markó Alexandra – Beke András: A zöngekezdési idő a beszédtípus függvényében

A felpattanó zárhangok zöngekezdési idejét a beszélő egyéni ejtési jellegzetességei mellett számos tényező, elsősorban a hangkörnyezet, a követő magánhangzó artikulációs konfigurációja befolyásolja. A magyar nyelvben az explozívákat olvasott szólista alapján vizsgálták a zöngésségi párok, a képzési hely, a követő és a megelőző hangzó, valamint a nemek közötti eltérések tekintetében. A zöngétlen felpattanó mássalhangzók zöngekezdési idejét spontán beszédben is elemezték a magyarban. A jelen tanulmányban az explozívák zöngekezdési idejét elemeztük magyar nyelvű spontán beszédben a mássalhangzó-minőség (zöngésség és képzéshely szerint), valamint a követő magánhangzó minőségének függvényében. Hipotéziseink szerint a) az explozívák VOT értékei függnek a mássalhangzó és a követő magánhangzó képzési jegyeitől is, illetve b) az explozívák a szólistákban realizálódott változatoktól eltérő módon jelennek meg a spontán beszédben. A vizsgálat anyagát az MTA Nyelvtudományi Intézetének Fonetikai Osztályán készülő beszélt nyelvi adatbázis spontán részei szolgáltatták. A zöngekezdési idő annotálásához a Praat 5.0 programot, a statisztikai elemzésekhez (ANOVA, MANOVA) az SPSS 13.0 szoftvert alkalmaztuk. Az eredmények rámutatnak arra, hogy a zöngésség-zöngétlenség minősége nem „digitális”, hanem fokozati természetű, ezáltal árnyalják, illetve kiegészítik a magyar felpattanó zárhangok fonetikai leírását.

Bata Sarolta: A beszélőváltások alakulása a társalgásban

A társalgás alapegysége a beszédlépés (turn, forduló), amely egy beszélő megszólalása a következő hallgatásig, azaz addig, amíg fel nem váltja egy másik beszélő. A társalgás szabályai szerint a beszélőváltás (turn-taking) történhet szóátadással (a korábbi beszélő kijelöli a következőt) és szóátvétellel (a következő beszélő önként folytatja a beszélgetést), illetve ha egyik sem történik meg, akkor az első beszélőnek van joga folytatni a társalgást. Vizsgálatunkban arra keressük a választ, hogy milyen fonetikai paraméterekkel jellemezhetők a beszélőváltások, illetve elemezzük, hogy a megjelenő formákhoz milyen funkciók kapcsolhatók. A kutatáshoz a BEA spontánbeszéd adatbázis háromszereplős társalgásait használtuk fel. Vizsgáltuk a társalgások során előforduló turnváltásokat a két forduló között eltelt időtartam, továbbá a váltást megelőző fonetikai jellemzők (pl. dallammenet) alapján. Az eredmények azt mutatják, hogy mind a beszélőváltásra alkalmas helyek jelölése, mind a beszélőváltás megjelenési formája különböző mintázatokat a funkciójától, azaz a beszédszándéktól függően. Az elemzés kiemeli a beszélőváltások speciális esetét, az egyszerre beszélést, amelynek ugyancsak különböző típusai jelentek meg. A beszédszándék alapján megkülönböztethetünk versengő és együttműködő egyszerre beszélési típusokat.

Módosítás dátuma: 2009. november 05. csütörtök, 15:30
 
Spontánbeszéd-kutató műhely, Powered by Joomla!