Pisanie głosowe czyli marzenie dziennikarza

To będzie doskonałe narzędzie przydatne w pracy dziennikarza. O ile pisanie głosowe w wersji Google poradzi sobie z rozumieniem tekstu.
Otwieram pusty dokument w przeglądarce Chrome. Klikam na pasku głównym „Narzędzia”, a potem na rozwijanej liście pojawia się „Pisanie głosowe”. Momentalnie pojawia się duża, czerwona ikona mikrofonu. Wystarczy zacząć dyktować. Mówię powoli, a przede wszystkim staram się to robić wyraźnie.
Mów panie, komputer twój słucha
Czuję jak opanowuje mnie euforia – to prawdziwa rewelacja, której się nie mogliśmy się doczekać od lat. Nowość podsunął na Linkedin Piotr Zieliński. Rewolucja dla każdego dziennikarza, który ma dość wstukiwania w klawiaturę godzinnych wywiadów tylko po to, by potem siedemdziesiąt procent tekstu wyrzucić do kosza. A wystarczy włączyć pisanie głosowe! Mówię i patrzę jak słowa zamieniają się w wyrazy, te w zdania. Co prawda bez kropek i przecinków, ale całe ciągi słów. Zaraz, zaraz, ale o co chodzi? Czytam to, co powiedziałem, ale na pewno nie to miałem na myśli:
Monotonny wstrzykiwanie treści nagranych na dyktafon odchodzi do lamusa mamy komputer mamy magiczną ikonkę I wystarczy kliknąć i dyktować uwaga Wszystko możliwe jest tylko wyłącznie w przeglądarce chrome postanowiłem sprawdzić jak to działa w praktyce wiadomo że maszyna nie jest doskonała a ludzki język często zawodny głos niewyraźny czasami mówimy za szybko jak to wszystko wyjdzie w praktyce zobaczę…
Przepraszam, nie piszę po pijaku – to co powyżej to oryginalny zapis tego, co z mojej mowy zrozumiał i zapisał komputer. Zdaję sobie sprawę, że nie mam dykcji aktora, ale starałem się naprawdę mówić wyraźnie. Cóż, takie są początki każdego wynalazku. Trzeba mieć nadzieję, że teraz będzie już tylko lepiej.
Co ciekawe, w tekście, który spisał z nagrania na telefon komórkowy „pośrednictwo” mój komputerowy robot zapisał jako „o średnicy 2”. „Zadłużenie” przerobił na „zaburzenie”, a propozycję ugody na „jagody”.
Dyktafonowa porażka
Ale co tam, nie zrażam się. Najważniejsze, że podczas, gdy urządzenie spisuje odtwarzane nagranie, mogę śledzić jego poprawność i w razie czego poprawić dane słowo. To do roboty. Mam nagranie rozmowy z właścicielami zakładu kamieniarskiego rozbudowanego i przebudowanego na zakład pogrzebowy. Nowoczesny, z piękną kaplicą czy salą pożegnań. Wiemy, że prawo budowlane na Podhalu nie przyjęło się. Toteż i nasi bohaterowie zwrócili się z prośbą o wydanie dokumentu o zgodności zmiany z z planem zagospodarowania przestrzennego – dopiero po zakończeniu inwestycji. Taka świecka tradycja.
Czytaj też: Jak napisać atrakcyjny tekst dla wyszukiwarek
Rozmawiam z małżeństwem właścicieli i ich prawniczką w holu zakładu. Czyli mamy 4 głosy i pogłos. Komputer zapisuje kilka pierwszych zdań:
Prowadzę zakład kamieniarski ceny rozbudować zamiast tego roku dla miasta w zamian za prowadnice po skończeniu od razu uruchomię Ponieważ zaś mi dała nam taka myśl chcieliśmy zainwestować jakieś pieniądze i tak dalej rozpoczęliśmy rozbudowę i żeby musiał wszelkie możliwe pomówienia plamy na to decyzję budowlaną od 9 budynków mamy na te wszystkie poświadczenia i uzyskaliśmy po prostu zgody na prowadzenie tutaj ty poszerzonej tej specjalne z kamienia na konia wystąpienie Kominiarska
W efekcie nie ma cudów, bym się domyślił, o co chodzi. Z „kamienia” na „konia” z „kamieniarza” na „kominiarza”, „plany” na „plamy„, ale jakie znowu „pomówienia„? Nie wiem.
Pisanie głosowe… może kiedyś?
Początkowa euforia wobec możliwości sztucznej inteligencji zaczyna mnie opuszczać. Do tego trzeba dodać, że po kilku akapitach mój komputerowy skryba się zawiesza. Niczym średniowieczny mnich, którzy zostawia niedokończony inicjał, bo musi się udać na nieszpory.
Mój prosty test nie wypadł obiecująco. Jeśli miałbym przekładać z polskiego na nasze godzinny wywiad zapisany jak wyżej – szlag by mnie trafił. I to szybciej niżbym miał wszystko przepisywać rylcem na glinianej tabliczce. Znacznie lepiej wypadło dyktowanie bez pośrednictwa dyktafonu. Gdy wiem, że to się zapisuje i mocno się staram mówiąc powoli i wyraźnie – pisanie głosowe wychodzi w miarę nieźle. Do momentu, gdy trochę przyspieszę, a e-skryba się pogubi w notowaniu komputerowych kulfoników.
Póki co, moim zdaniem, pisanie głosowe w wersji Googla kompletnie się nie sprawdza. Ale możemy być spokojni – na pewno teraz szybko nastąpi nauka nowych funkcji. Pamiętacie translatora sprzed lat i tego dzisiejszego? Wiem, wiem, wciąż jest nie najlepiej, ale postęp jest ogromny.
Być może w końcu i my doczekamy się swojego skryby w komputerze. Takiego do nas nie tylko zrozumie, ale i ułoży dyktowane słowa w logiczną całość, podzieloną znakami interpunkcyjnymi. Cierpliwości. Cyfrowa rewolucja nadchodzi.
Póki co, zachęcam do testowania pisania głosowego – to naprawdę świetna zabawa na długie wieczory czasów zarazy.
Obraz fernando zhiminaicela z Pixabay