Direktlänk till inlägg 20 mars 2012

En fråga om språkstatistik

Svenska Dagbladet publicerade i fredags en intressant och initierad artikel, ”Hen”-kulturer är inte mer jämställda, av Mikael Parkvall. Jag hakade dock upp mig på ett påstående:


I debatten nämns enbart finska (och ibland mandarin) som exempel på pronominellt könsneutrala språk, som vore de undantag. Vad som lätt glöms bort är att de i själva verket representerar normaltillståndet – en majoritet av världens språk har alltså inte någon könsdistinktion i sitt pronomensystem (min fetstil).”


Jag är intresserad av källan till detta påstående. Observera att jag inte påstår att det förhåller sig tvärtom. I en tidigare kommentar i denna blogg skriver Östen Dahl:


Fakta i målet är att hur man än definierar genus, så saknas genus i grammatiken hos åtminstone hälften av alla världen språk, och distinktionen mellan manligt och kvinnligt finns inte i mer än sådär en tredjedel  - se http://wals.info/feature/31A.”


Denna förteckning upptar dock bara 257 språk, d.v.s c:a 4 procent av världens minst 6000 språk. Det går knappast att se det som ett representativt urval. Hur gör man ett representativt urval av språk – 4 procent av alla språk på varje kontinent? Om Mikael har en annan källa, vore det intressant att ta del av den. Som lekman blir jag naturligtvis också överraskad över att alla världens språk skulle vara kartlagda och beskrivna, i synnerhet avseende på pronomensystemen.


Per-Åke Lindblom


(Denna nätdagbok är knuten till nätverket Språkförsvaret)

 
 
Ingen bild

MP

21 mars 2012 21:59

Jo, det är ett representativt om än långt ifrån heltäckande urval.

Så gott som inget påstående om världens språk tar fler i beaktande än detta. Man bör för det första komma ihåg att ingen vet någonting om hälften av dessa sex tusen. Och för det andra är ett par hundra ofta just ett representativt urval, om än begränsat. Urvalet är gjort för att inkludera några från varje kontinent och från varje språkfamilj. Och det är just det som är representativitet. Det är ungefär som en sifo-undersökning. Ingen sådan täcker mer än 4% av svennarna (det skulle ju bli flera hundra tusen).

Om representativitet betyder att man täcker mer än 50% av populationen, (men en slumpvis hälft?), då kan ingen säja nånting om vare sig språk eller partisympatier.

Så: tre tusen språk är helt odokumenterade. Ingen nu levande person har koll på ens de återstående tre tusen. Likaväl som sifo (eller motsvarande) inte vet vad nio miljoner svennar tänker rösta på i riksdagsvalet. Men det är just ett representativt urval som låter oss komma så nära som någon människa alls kan komma.


/mp

 
Ingen bild

Östen

21 mars 2012 22:03

Instämmer i stort sett med Micke. Det finns dock en viss skevhet i WALS-samplen som beror på att man ville ha med de språk som alla känner till, vilket betyder de största som också i stor utsträckning är indoeuropeiska. I det här sammanhanget betyder det att språk med könsbaserade genusdistinktioner förmodligen är överrepresenterade. Med tanke på denna osäkerhet skrev jag "sådär en tredjedel". Men det är osannolikt att det är fler. Sen så finns det ingen information om var genusdistinktionerna dyker upp. Man kan alltså inte vara säker på att det är i pronomensystemet. Hindi skiljer exempelvis på maskulina och feminina substantiv men gör ingen skillnad på tredjepersonspronomen (se Wikipedia om detta). Man kan misstänka att detta gäller också för en del andra indiska språk. Om det här mönstret är utbrett (vilket jag inte har någon information om) skulle det betyda att andelen språk med könsdistinktion i pronomen är ännu lägre.

 
Ingen bild

Östen Dahl

21 mars 2012 23:21

Se nu en vidare kommentar på Lingvistbloggen:
http://lingvistbloggen.ling.su.se/?p=1711

 
Ingen bild

Per-Åke Lindblom

22 mars 2012 20:00

Jag reagerade fr.a mot nedanstående påstående i Mikael Parkvalls artikel http://www.svd.se/kultur/understrecket/hen-kulturer-ar-inte-mer-jamstallda_6927977.svd
”Vad som lätt glöms bort är att de i själva verket representerar normaltillståndet – en majoritet av världens språk har alltså inte någon könsdistinktion i sitt pronomensystem (min understrykning).”
Om någon skrev att majoriteten av fastighetens invånare brann inne, så skulle jag tolka den satsen som att minst 51 av 100 invånare blev innebrända – inte högst 4 av hundra. Corbetts förteckning omfattar nämligen bara 4 procent av världens språk.
Nu menar Mikael att urvalet ändå är representativt. Jag anser att Östen Dahls genomgång http://lingvistbloggen.ling.su.se/?p=1711 visar att det enbart är fråga om sannolikhetskalkyler, kvalificerade gissningar. Det är mycket möjligt att dessa kan vara i huvudsak korrekta, men felmarginalen kan också vara stor.
Jag har naturligtvis aldrig föreställt mig att opinionsundersökningar i fråga om partisympatier hos Sveriges befolkning måste omfatta hälften av landets invånare för att vara representativa. I sådana undersökningar opererar man med bestämda variabler som åldersfördelning, kön, inkomstförhållanden, tätort/landsbygd etc. för att få ett urval, som motsvarar befolkningens sammansättning. Dessutom har man lång erfarenhet av opinionsundersökningar och kan stämma av dem med valresultaten. På tusen tillfrågade brukat felmarginalen vara 2 – 3 procent.
Det finns metodologiska problem med Corbetts sammanställning. Man ska kanske inte skylla på Corbett utan på Corbetts uttolkare. Vilka slutsatser kan man utifrån denna dra vad gäller språk som aldrig har undersökts, d.v.s hälften av världens språk? Antag att någon genomförde en undersökning angående förekomsten av benskörhet, eller användningen av timjan contra mejram i ärtsoppan, enbart i Götaland (med halva Sveriges befolkning). Undersökningarna är visserligen omfattande, men kan man utifrån dessa dra några säkra slutsatser angående förekomsten av benskörhet, eller användningen av timjan/mejram i ärtsoppan, vad gäller Svealand/Norrland (med resten av Sveriges befolkning), som alltså inte undersökts i dessa avseenden? Felmarginalerna skulle säkert vara stora; förmodligen skulle inte ens en statistiker i förväg kunna uppskatta felmarginalerna.
Uppträder vissa typologiska drag i språk med någon slags regelbundenhet i språken? Kan man med visshet utifrån förekomsten av ett visst språkdrag hos ett antal språk göra förutsägelser om samma språkdrag hos språk, som ännu inte undersökts?
Det framgår heller inte vilka urvalskriterier som Corbett har använt. Östen skriver: ”Jag sa dock att det kan finnas en viss skevhet eftersom redaktörerna för WALS gärna ville ha med alla mera bekanta språk, vilket har gett en överrepresentation bl.a för indoeuropeiska språk.” I så fall är redan på denna punkt inte urvalet helt slumpmässigt. Vissa mera bekanta språk som svenska, danska och norska liksom de två stora ostasiatiska språken japanska och koreanska finns inte med. Enligt uppgift talar japanska kvinnor i vissa sammanhang på ett särskilt sätt för att understryka sin kvinnlighet. Där har vi en annan typ av könsmarkör.
Man kan naturligtvis som Östen gör, välja ut de tio största språkfamiljerna och anta att de övriga ingående språken (som inte Corbett listar) i respektive språkfamilj uppför sig på samma sätt. Samtidigt går det inte att utesluta stora variationer språken emellan. Hur många indoeuropeiska språk har egentligen bestämd slutartikel? För språkisolaten finns naturligtvis inget gemensamt mönster.
Om Mikael hade skrivit att ”en majoritet av 257 undersökta språk i världen inte har någon könsdistinktion i sitt pronomensystem”, hade det inte varit något problem. Det påståendet är ju lätt att undersöka. Men en utsaga om världens alla språk, varav hälften inte ens är undersökta, går varken att verifiera eller falsifiera. Det är inte fråga om representativitet utan om mer eller mindre rimliga uppskattningar. Därmed inte sagt att Östens uppskattningar skulle vara orimliga.

Per-Åke Lindblom

 
Ingen bild

Per-Åke Lindblom

7 april 2012 15:53

Östen skriver på Lingvistbloggen - http://lingvistbloggen.ling.su.se/?p=1711: ”Per-Åke, jag undrar om ditt intresse för den här frågan är rent vetenskapsteoretiskt eller om det skulle störa din världsbild om våra kvalificerade gissningar skulle stämma?”
Det är bra att du erkänner att det är fråga om en ”kvalificerade gissningar”. Vad jag har kritiserat är ju Mikaels påstående i SvD-artikeln att ”en majoritet av världens språk har alltså inte någon könsdistinktion i sitt pronomensystem.” Den utsagan implicerar ju att alla världens språk är undersökta, vilket de inte är. Som jag skrev tidigare, hade det inte varit något problem om Mikael i stället hade skrivit att ”en majoritet av 257 undersökta språk i världen inte har någon könsdistinktion i sitt pronomensystem”.
Östen frågar också om det skulle störa min världsbild om hans och Mikaels kvalificerade gissningar skulle stämma. Fråga är felställd redan av den anledningen att jag aldrig påstått att deras kvalificerade gissningar inte skulle stämma. Dessutom ingår det inte i min världsbild att hysa förutfattade meningar om något. Utan undersökning ingen rätt att tala, eller om man så vill: Vad man inte kan tala om, därom måste man tiga.
I en artikel om ”hen”, som publicerats i bl.a Newsmill, skriver jag: ”Mig veterligt skiljer alla indoeuropeiska språk på levande och döda ting. Inom kategorin levande görs en åtskillnad mellan manligt och kvinnligt. Detta ger upphov till maskulinum, femininum och neutrum i språket.”
Jag påstår faktiskt inte ens att alla indoeuropeiska språk skulle ha kvar uppdelningen i maskulinum, femininum och neutrum, eftersom jag var medveten om att det har skett förändringar i genussystemen under tidernas gång. Vissa indoeuropeiska språk har reducerat genussystemet, medan åtminstone polskan har byggt ut det.
Min skrivning överenstämmer ganska väl med denna skrivning i engelskspråkiga Wikipedia http://en.wikipedia.org/wiki/Grammatical_gender, som jag såg senare:
“Research indicates that the earliest stages of Proto-Indo-European had two genders, animate and inanimate, as did Hittite, but the animate gender (which, in contrast to the inanimate gender, has an independent accusative form) later split into masculine and feminine, originating the classical three-way classification into masculine, feminine, and neuter which most of its descendants inherited] Many Indo-European languages kept these three genders.”
Jag har också skrivit att ”Alla språk har lexikaliserat semantiska allmänbegrepp som man-kvinna, pojke-flicka, son-dotter”. Detta är ett tvärsäkert påstående, men om någon kan påvisa att det finns ett språk, som inte tillämpar denna dikotomi, kommer jag genast att börja skriva ”nästan alla språk”.
Huvudfrågan i debatten är annars frågeställningen om införandet av ”hen” kommer att bidra till att könsrollerna förändras och om det är möjligt att språket besitter en sådan kraft att det kan förändra verkligheten. Lättversionen att ”hen” skulle täppa till en lucka i språket, när syftningen på könet är okänd eller irrelevant, är egentligen ganska ointressant. Hade det verkligen funnits ett sådant behov, skulle ”hen” slagit igenom för länge sedan förutan alla kampanjer.

Från
    Kom ihåg mig
URL

Säkerhetskod
   Spamskydd  

Kommentar

Av Nätverket Språkförsvaret - Torsdag 28 mars 08:00

Universitetsläraren rapporterar:   ”En utgångspunkt för den norska regeringens handlingsplan är att mer undervisning sker på engelska och att det i vetenskapliga publikationer har skett en kraftig nedgång av det norska språket i förhållande...

Av Nätverket Språkförsvaret - Onsdag 27 mars 08:00

Som många noterat har service på restauranger i Sverige förändrats de senaste 10 åren. I de större städerna stöter man ofta på personal som knappt kan svenska utan bara engelska. De verkar intalade att alla svenskar gärna pratar engelska.   När...

Av Nätverket Språkförsvaret - Tisdag 26 mars 12:00

Stefan Lindgren skriver på Facebook:   ”Läs Cronemans krönika i DN från 16/3. Jag håller helt med honom, även om han är 30 år sen med dessa insikter.   Och har man väl sagt A måste man säga B. Det är sjukt att svenska högskolelärare ska...

Av Nätverket Språkförsvaret - Måndag 25 mars 13:00

I artikeln ”Den nordiska språkgemenskapens kris” skriver Samuel Larsson inledningsvis:   ”Den eviga frågan om hur väl danskar och svenskar förstår varandras språk har blivit aktuell igen. Frågan är ju lika gammal som Öresund o...

Av Nätverket Språkförsvaret - Söndag 24 mars 08:00

Söndagens svenskspråkiga sång   Kjell Höglund - Mina vingar   Söndagens svenskspråkiga dikt   Tanken   Tanke, se, hur fågeln svingar under molnet lätt och fri; även du har dina vingar och din rymd att flyga i.   Klaga ej, att du v...

Presentation

Omröstning

Är älvdalskan ett språk eller en dialekt?
 Älvdalskan är ett språk
 Älvdalskan är en dialekt
 Vet inte

Fråga mig

142 besvarade frågor

Kalender

Ti On To Fr
      1 2
3
4
5 6 7
8
9
10
11
12
13
14 15
16
17 18
19 20 21 22 23 24
25
26 27 28
29
30 31
<<< Mars 2012 >>>

Tidigare år

Sök i bloggen

Senaste inläggen

Senaste kommentarerna

Kategorier

Arkiv

RSS

Besöksstatistik

Säg hellre!

Irriteras du av ett onödigt engelskt lånord och kan föreslå ett ersättningsord?  Skicka det i så fall till ersattningsordet@sprakforsvaret.se.  Om granskningsgruppen tycker att det är ett bra ord, belönas du med "Svenskan - ett språk att äga, älska och ärva" och ordet förtecknas också i avdelningen "Säg hellre!"

Blogtoplist


Skapa flashcards