Diktování do počítače a psaní na klávesnici v praxi

Politická strana TOP 09 od svého vzniku v roce 2009 na svých sněmech vždy nabízela kvalitní servis pro novináře a své členy či podporovatele v podobě videozáznamu, on-line přenosu, ale také rychlého přepisu prakticky všeho, co zaznělo. Tyto informace využívá nejenom široká veřejnost, která je má nabízeny přes webové stránky a sociální sítě, ale i profesionálové – novináři a analytici, kteří získávají rychlou a zejména kvalitně zpracovanou vstupní informaci pro svou práci. Během šesti let došlo ve zpracování informací k aplikování celé řady postupů. Tento článek se zaměřuje na zkušenosti s nasazením rozpoznávání hlasu a přepisem s použitím unikátní metodiky ZAV.

Od ustavujícího sněmu TOP 09 na konci listopadu 2009 byly pro záznam a zpracování informací využívány dvě technologie. Klasická audiovizuální nahrávka, která byla zároveň streamována na internet, byla doplněna o dvojí záznam mluveného slova (MP3), který sloužil zejména k přepisu. Posléze byl tento používán pro zpětnou kontrolu a tzv. dočištění textu, protože většinu informací byly schopni dva zapisovatelé nabídnout v reálném čase. Výjimkou byly projevy těch řečníků, jejichž rychlost řeči byla vyšší a kteří nedali alespoň koncepty textů k dispozici před samotným projevem.

V roce 2013 došlo k nasazení nových technologií. Díky rozšíření služeb serveru YouTube bylo nejenom možné vysílat on-line přenos, ale zároveň se v tomto přenosu volně vracet v čase. Tato funkce de facto nahradila speciální MP3 audionahrávky. Stream je dosud jištěn druhým audiovizuálním záznamem, avšak ten je pořizován už jen z důvodů nečekaného selhání techniky. V témže roce také došlo k nasazení technologie pro záznam řeči, který byl jištěn značným počtem zapisovatelek – zhruba 8 osob. Tyto zapisovatelky měly zpracovat text přepsaný počítačem – opravit jej a provést nezbytné stylistické úpravy. Plán byl, že na opravách budou pracovat čtyři dvoučlenné týmy. Při nasazení systému jsme zjistili tyto nevýhody:

  1. Záznam lze převádět až po jeho dokončení. Došlo tedy k situaci, že zapisovatelé čekali třeba i desítky minut než projev skončí. Situaci asi lze řešit větším nasazením techniky, což zvyšuje náklady na přepis (technika a její obsluha).
  2. Vysoká chybovost. Hlasy účastníků sněmu jsou z velké části neškolené. Množství chyb, které systém generoval, kladlo takové nároky na korektory, že bylo lepší text znovu přepsat.

Ještě v průběhu sněmu došlo k odstavení počítačového záznamu řeči, protože kombinace výše uvedených faktorů zapříčinila zpracování informací s velkou časovou ztrátou, což byl zejména pro profesionální využití vážný handicap. Změnil se systém práce a zapisovatelky se věnovaly přepisu klasickou cestou. Ty, které zvládaly vyšší rychlost záznamu, tedy psaní všemi deseti, psaly rovnou to, co slyšely, a druhá skupina jejich texty opravovala s využitím YouTube s možností posunu v čase. Díky této změně došlo k opětovnému snížení časové prodlevy a využitelnosti zápisu.

O dva roky později i na základě zkušeností z roku 2013 byla obnovena spolupráce s tříčlenným týmem využívající technologii ZAV. Vstupní data poskytoval kanál TOP 09 na serveru YouTube a došlo i k projednání nabídky zajistit zpracování textu z jiného místa. Vzhledem k občasným výpadkům internetu na pracovišti ZAV se to nerealizovalo, byť jsem přesvědčen, že v dalším období bude využitá.

Kombinace zapisovatelů píšících vysokou rychlostí a rozdělení rolí v relativně malém týmu dovolilo absolutně minimalizovat časové ztráty. V roce 2015 také nebyla od objednavatele potřeba žádného speciálního vybavení než stabilní vysokorychlostní internet. Pro představu nejnáročnějším vstupem byl osm a půl minuty trvající emotivní projev, přes vysokou rychlost řeči byl odevzdán k publikování dvacet minut po jeho skončení. Na tomto místě bych rád vysvětlil, že – vzhledem k velkému tlaku médií na rychlost – TOP 09 zveřejňuje přepis v hrubé verzi a následně (v řádu desítek minut) nahrává korektury, podobně zveřejňuje své přepisy i Poslanecká sněmovna. V tomto případě zmiňuji opravdu finální verzi textu. Na kvalitním výstupu se projevilo bezesporu to, že v týmu ZAV jsou profesionálové, ne každý tým může mít ve svých řadách světové šampiony nebo vicemistry světa.

Aplikování různých způsobů záznamu a zpracování informací dovolilo organizátorům této akce formulovat dva závěry:

  1. Pro český jazyk a prostředí s necvičeným řečníkem je stále v poměru cena x výkon nejvýhodnější kvalifikovaný zapisovatel, který ovládá klávesnici všemi deseti a zároveň zvládá český pravopis.
  2. Vývoj technologií mění a zlevňuje celý proces zpracování informací. Umožňuje práci z jiného prostředí. Audiovizuálním záznam je flexibilnější a výrazně levnější. Textová informace pořád nabízí snadnější indexaci a vyhledatelnost.

Jaroslav Poláček
volební manažer TOP 09
místopředseda Interinfo ČR