Brezplačne avdio knjige: Projekt Gutenberg ponuja prihodnost

headphones on books, audiobooks concept
Foto: knoppper iz iStock

Avdio knjige so se v zadnjem času uveljavile tudi pri nas. A njihovo snemanje je lahko težavno in drago. Raziskovalcem pa je uspel nov preboj na področju pretvarjanja besedil v govor: kmalu boš z avtomatizirano metodo avdio knjige lahko generiral kar sam. V sklopu Projekta Gutenberg so namreč ustvarili tisoče avdioknjig klasične literature, ki so bralcem dostopne brezplačno.

Raziskovalci pri Microsoftu in MIT-u so skupaj ustvarili zbirko, ki med drugim vključuje dela Shakespeara, Agathe Christie, Jane Austen, Leonarda Da Vincija in drugih svetovnih umetnikov. S programsko opremo, ki besedilo pretvori v govor, so prišli do avdioknjig, ki zvenijo naravno. Koda, ki so jo pri tem uporabili je dostopna na GitHub-u, knjige pa ponujajo Internet Archive, Spotify, Apple Podcasts in Google Podcasts.

Projekt Gutenberg za ustvarjanje avdio knjig

Projekt Gutenberg že desetletja sestavlja knjižnico brezplačne literature v obliki besedila, a z avdioknjigami bi material postal še dostopnejši. Vendar ustvarjanje avdioknjig s pomočjo tradicionalnih metod zahteva veliko časa in denarja. Oseba mora namreč celotno knjigo v celoti prebrati na glas. Z ekonomskega stališča zato ni smotrno vseh knjig, vrednih branja, ročno posneti. Pretvorba besedila v govor se tako pri Projektu Gutenberg izkaže kot odlična rešitev. Ki pa se mora najprej spopasti s kopico ovir, ki ovirajo orodja umetne inteligence.

About Project Gutenberg - American English Podcast

Prva med njimi je, da mora biti končni rezultat čim bolj podoben človeškemu glasu. Raziskovalci v projektu so se osredotočali na zvok, ki je najbolj primeren za neliterarna dela in pripoved. Kot uporabnik pa lahko z manjšimi spremembami programa bolj ali manj uspešno prideš do dramatičnega branja. Prvi korak v celotnem procesu je sama izbira digitalnih knjig, ki so primerne za pretvorbo. Projekt Gutenberg namreč material zbira v različnih formatih. Med njimi so tudi datoteke z napakami in nepopolni skeni. Zato so se pri projektu osredotočali na datoteke HTML. Ko bereš knjige, ti je jasno, katero besedilo je del zgodbe in namenjeno branju ter kaj lahko ignoriraš. S posebnim sistemom so raziskovalci dosegli, da je tudi program prepoznal različne komponente, kot so kazalo, številke strani, opombe, preglednice in drug zunanji material.

V prihodnosti nameravajo raziskovalci omogočiti še bolj individualno izkušnjo. Bralcem bi radi omogočili, da knjigo slišijo v njihovem lastnem glasu. Tako boš morda kmalu glasno prebral (in posnel) le prvih nekaj vrstic knjige, s tem »natreniral« algoritem v ozadju programa in nato poslušal celotno knjigo, kot bi jo bral sam. Kopijo avdioknjige boš prejel na elektronsko pošto in si jo tako lahko tudi shranil.

VIRTECHSPOT
Prejšnji članekZastopal nas bo na podnebnih pogajanjih: Kdo je prvi mladinski podnebni delegat Slovenije?
Naslednji članekPoslanec Levice jasno: Priznanje palestinske države je edini način

Uporabljamo Akismet za manjšanje neželenih oglasnih komentarjev (spam). Politika zasebnosti.