Direktlänk till inlägg 21 september 2012

De flesta europeiska språk står inför digital utrotning

Av Nätverket Språkförsvaret - 21 september 2012 15:24

(Rubriken på detta pressmeddelande har satts av oss)

 

En studie av Europas ledande språkteknologiska experter varnar för att flertalet europeiska språk förmodligen inte kommer att överleva i den digitala tidsåldern

 

De flesta europeiska språk står inför digital utrotning, visar en ny studie från Europas ledande experter inom språkteknologi. Genom att uppskatta nivån av språkteknologiskt stöd för 30 av de cirka 80 europeiska språken, drar experterna slutsatsen att det digitala stödet för 21 av de 30 undersökta språken är ”obefintligt” eller som bäst ”svagt”. Studien genomfördes av META-NET, ett europeiskt spetsforskningsnätverk som består av 60 forskningscentra i 34 länder.


I studien, som utförts av fler än 200 experter och dokumenteras i 30 volymer av META-NETs vitboksserie (tillgänglig både online och i tryckt form), bedöms det språkteknologiska stödet för varje språk inom fyra olika områden: automatisk översättning, talad interaktion, textanalys samt tillgången till språkresurser. Totalt 21 av de 30 språken (70 %) placerades av experterna i den sämsta kategorin, där ”stödet är svagt eller obefintligt” för åtminstone ett område. Flera språk, till exempel isländska, lettiska, litauiska och maltesiska, får detta betyg för alla fyra områden. I den andra änden av skalan fanns inget språk som ansågs ha ”utmärkt stöd”, och bara engelska som bedömts ha ”bra stöd”, följt av språk som franska, holländska, italienska, spanska och tyska med ”måttligt stöd”. Språk som baskiska, bulgariska, grekiska, katalanska, polska och ungerska har "fragmentariskt stöd", vilket placerar också dem i gruppen av högriskspråk 1).


”Resultaten av vår studie är högst oroväckande. Flertalet av de europeiska språken lider av en stor brist på resurser och vissa är nästan helt försummade. I det avseendet är många av våra språk är ännu inte framtidssäkrade.”, säger professor Hans Uszkoreit, samordnare för META-NET, vetenskaplig ledare på DFKI (tyska forskningscentret för artificiell intelligens) och medredaktör för studien. Studiens andra medredaktör, Dr Georg Rehm (DFKI), tillägger: ”Det finns dramatiska skillnader mellan det språkteknologiska stödet för olika europeiska språk och teknikområden. Klyftan mellan ’stora’ och ’små’ språk ökar fortfarande. Vi måste se till att utrusta alla mindre språk och språk med få resurser med den nödvändiga basteknologin, annars är dessa språk dömda till digital utplåning.”


Inom det språkteknologiska området utvecklas programvara som kan hantera talat eller skrivet mänskligt språk. Välkända exempel på språkteknologisk programvara inkluderar stavnings- och grammatikkontroll, interaktiva personliga assistenter i smarttelefoner (som Siri i iPhone), dialogsystem som fungerar över telefon, automatiska översättningssystem, sökmotorer för webben och talsyntes som används i bilars navigationssystem. Idag förlitar sig de språkteknologiska systemen främst på statistiska metoder som kräver enorma mängder data i form av text eller tal. Speciellt för språk med relativt få talare är det svårt att få ihop tillräckligt mycket data. Dessutom har statistiska språkteknologiska system inneboende begränsningar i kvalitet, vilket exempelvis kan ses i de ofta roliga felöversättningar som produceras av online-system för maskinöversättning.


Europa har lyckats ta bort nästan alla gränser mellan sina länder. En gräns kvarstår dock, och den verkar vara ogenomtränglig: Språkbarriärer utgör en osynlig gräns som hindrar det fria flödet av kunskap och information. Den motverkar också det långsiktiga målet att etablera en gemensam digital marknad, eftersom den hindrar det fria flödet av varor, produkter och tjänster. Även om språkteknologi har potential att ta bort språkliga hinder genom moderna system för maskinöversättning, så visar resultatet av META-NETs studie tydligt att många av de europeiska språken ännu inte är redo. Det finns stora luckor i tekniken vilka beror på att större delen av forskningen och utvecklingsarbetet fokuserar på engelska, på bristande engagemang och ekonomiska resurser, och även på avsaknad av en tydlig vision för forskning och teknik.


För att skapa och sprida den teknik som behövs för de flesta europeiska språk krävs en samordnad, storskalig satsning i Europa. Det finns starka skäl för att ta sig an denna enorma utmaning i en gemensam kraftansträngning mellan den Europeiska unionen, dess medlemsstater och associerade länder samt industrin. Några av dessa skäl är: hög per capita-kostnad för mindre språkgemenskaper, behovet av tekniköverföring mellan olika språk, bristande interoperatiblitet mellan resurser, verktyg och tjänster, samt det faktum att språkliga gränser ofta inte sammanfaller med politiska gränser. Europa måste vidta åtgärder för att förbereda sina språk för den digitala tidsåldern. De är en värdefull del av vårt kulturarv och som sådan förtjänar de att framtidssäkras. Den 26:e september har av Europarådet utsetts till den europeiska språkdagen, en dag då vi begrundar vikten av att bevara och utveckla vår kontinents rika språkliga och kulturella arv. META-NETs arbete sätter fingret på de utmaningar och möjligheter som vårt språkliga arv står inför i informationstidsåldern.


Språkteknologi: Bakgrund

Språkteknologi hjälper oss redan i vardagliga sysslor, som att skriva e-post eller köpa biljetter. Vi får hjälp av språkteknologi vid sökning efter och översättning av webbsidor, vid ordbehandling för stavnings- och grammatikkontroll, när vi styr underhållningssystemet i bilen eller vår mobiltelefon med röstkommandon, när vi får rekommendationer i en online-bokhandel, eller när vi följer instruktioner upplästa av en mobil navigerings-app. Inom en snar framtid kommer vi att kunna tala med datorprogram såväl som med maskiner och apparater, inklusive de efterlängtade servicerobotar som snart kommer att göra sitt inträde i våra hem och på våra arbetsplatser. Var vi än är, kommer vi helt enkelt att be om den information och hjälp vi behöver. När vi blir av med kommunikationshinder mellan människor och teknik kommer hela vår värld att förändras.


Språkteknologin är idag allmänt erkänd som ett av de viktigaste tillväxtområdena inom informationstekniken. Stora internationella företag som Google, Microsoft, IBM och Nuance har investerat stort inom detta område. I Europa har hundratals små och medelstora företag specialiserat sig på olika språkteknologiska applikationer och tjänster. Språkteknologi tillåter människor att samarbeta, utbilda sig, göra affärer och dela kunskap över språkgränserna och oberoende av deras datakunskaper.


Meta-NETs vitboksserie

META-NETs vitboksserie ”Språken i det europeiska informationssamhället” rapporterar om tillståndet för 30 europeiska språk med avseende på språkteknologi och förklarar vilka de mest överhängande riskerna och de största möjligheterna är. Serien omfattar alla officiella EU-språk och flera andra av de europeiska språken. Även om det tidigare funnits flera värdefulla och omfattande vetenskapliga studier om olika aspekter av språk och teknik, så har det hittills inte funnits någon lättillgänglig sammanställning som presenterar de viktigaste resultaten och utmaningarna för varje språk när det gäller ett teknikstött flerspråkigt Europa. Meta-NETs vitboksserie fyller denna lucka. META-NET kan nu visa varför flertalet språk står inför allvarliga problem och peka på de mest ödesdigra bristerna. Totalt har mer än 200 författare och bidragsgivare hjälpt till att utarbeta vitboksserien.


Vitböckerna finns för följande europeiska språk: baskiska, bulgariska, danska, engelska, estniska, finska, franska, galiciska, grekiska, iriska, isländska, italienska, katalanska, kroatiska, lettiska, litauiska, maltesiska, nederländska, norska (bokmål och nynorska), polska, portugisiska, rumänska, serbiska, slovakiska, slovenska, spanska, svenska, tyska, tjeckiska och ungerska. Varje språks vitbok är skriven på det språk som den rapporterar om och innehåller även en komplett engelsk översättning.


Om META-NET och META

META-NET är ett spetsforskningsnätverk bestående av 60 forskningscentra från 34 länder, vars mål är att bygga den tekniska basen för ett flerspråkigt europeiskt informationssamhälle. META-NET samfinansieras av EU-kommissionen genom totalt fyra projekt.


META-NET har tagit initiativet till META, Multilingual Europe Technology Alliance. Mer än 600 organisationer från 55 länder, inklusive forskningscentra, universitet, små och medelstora företag liksom ett antal storföretag har redan gått med i denna öppna teknikallians.


Bakgrundsinformation:

http://www.meta-net.eu
http://www.meta-net.eu/whitepapers
http://www.meta-net.eu/whitepapers/all-quotes-and-testimonials
http://www.meta-net.eu/whitepapers/press-release(inklusive ca. 30 översättningar avdetta pressmeddelande)


-----------
Martha D. Brandt
Språkbanken - Centre for Language Technology
Department of Swedish
University of Gothenburg
Box 200
SE-405 30 Gothenburg
Sweden

Visiting address:
Lennart Torstenssonsgatan 8, Rum L306

http://spraakbanken.gu.se/eng/personal/martha


1) Vår anmärkning: Även svenskan hamnar i gruppen med "fragmentariskt stöd".


(Denna nätdagbok är knuten till nätverket Språkförsvaret)

 
 
Ingen bild

inga johanson

21 september 2012 20:57

Små språk och digital utrotning.
Ett exempel från den digitala världen:
På Wikipedia håller man reda på hur mycket som skrivs på varje språk.
Engelska har idag 21/9 drygt 4 millioner artiklar
Tyska 1,4 millioner; Franska 1,2 millioner
Nederländska 1,1 millioner.
Arabiska är ju i verkligheten ett stort språk men på Wikipedia ser det ut att vara ett språk som inte så många använder digitalt.
Idag finns 196 000 artiklar på arabiska.
Jämför denna siffra med Esperanto (drygt 170 000);
danska (169 000) och Volapük (119 000)
Antalet användare av Volapük är i realiteten få, men någon har
sett till att översätta massvis av artiklar.
För övrigt är Volapük i danskan en metafor som översätts till "rappakalja" på svenska (som i sin tur är ett finskt begrepp)

Jag sökte förgäves efter Wikipedia på Klingon, men hittade bara
artiklar om Klingon på 46 av de språk som finns i Wikipedia.


 
Ingen bild

lr.

25 september 2012 00:33

Ā propos Wikipedia:
Här finner ni mer intressant språkstatistik:

http://stats.wikimedia.org/wikimedia/squids/SquidReportPageViewsPerCountryTrends.htm

Som ni kan se använder 55.5% i Sverige Wikipedia på svenska medan 37.3% använder den på engelska och resten på andra språk.

Från
    Kom ihåg mig
URL

Säkerhetskod
   Spamskydd  

Kommentar

Av Nätverket Språkförsvaret - Måndag 18 mars 13:00

”I spalten ’Kort fråga, kort svar’ har redaktionen för radiostationen SWR3 i Tyskland undersökt frågan om hur många ord det tyska ordförrådet innehåller. Hanna Gottschalk från Föreningen för det tyska språket i Mannheim förklarar at...

Av Nätverket Språkförsvaret - Söndag 17 mars 08:00

Söndagens svenskspråkiga sång   Magnus Uggla & Tommy Körberg - Moder Svea    Söndagens svenskspråkiga dikt   Vår nationalsymbol kallas Svea hon försåldes i morse på rea. Det nationella är slut så nu kastas hon ut och förresten s...

Av Nätverket Språkförsvaret - Lördag 16 mars 12:37

På ditt modersmål kan du säga vad du vill, på andra språk det du kan!   Ovanstående är värt att betänka för alla de som medvetet eller omedvetet verkar för att ge engelskan en allt större betydelse i vårt samhälle och på vårt modersmåls bekostnad...

Av Nätverket Språkförsvaret - Fredag 15 mars 14:34

  Det sägs ganska allmänt bland lingvister att lånord (ett ganska fånigt ord då det sällan eller aldrig handlar om ett lån och en generös långivare)  inte utgör något hot mot ett språk. Och så brukar det komma en långdragen historia där man har svå...

Av Nätverket Språkförsvaret - Torsdag 14 mars 08:00

  Så var då den svenska delen av melodifestivalen över för den här gången. Det blev precis som i Vasaloppet: norrmännen vann. Men hur gick det till?   Med ett litet undantag så var som vanligt alla bidrag på engelska. Inte nog med det, man har ...

Presentation

Omröstning

Är älvdalskan ett språk eller en dialekt?
 Älvdalskan är ett språk
 Älvdalskan är en dialekt
 Vet inte

Fråga mig

142 besvarade frågor

Kalender

Ti On To Fr
          1 2
3
4 5
6
7 8
9
10 11
12
13
14
15 16
17 18 19 20 21 22 23
24 25 26
27
28
29
30
<<< September 2012 >>>

Tidigare år

Sök i bloggen

Senaste inläggen

Senaste kommentarerna

Kategorier

Arkiv

RSS

Besöksstatistik

Säg hellre!

Irriteras du av ett onödigt engelskt lånord och kan föreslå ett ersättningsord?  Skicka det i så fall till ersattningsordet@sprakforsvaret.se.  Om granskningsgruppen tycker att det är ett bra ord, belönas du med "Svenskan - ett språk att äga, älska och ärva" och ordet förtecknas också i avdelningen "Säg hellre!"

Blogtoplist


Skapa flashcards