DEL B: INDLEDENDE ANALYSE

DEL B: INDLEDENDE ANALYSE

4.1 Indhold

Spørgeskemaets indhold svarer til det indledende telefonspørgeskema samt de to spørgeskemaer til henholdsvis mand og kvinde. Følgende er en kritisk gennemgang af alle tre skemaer ud fra reliabilitet og validitet. Ved reliabilitet forstås, at vi har pålidelige målinger, og om respondenterne forstår spørgsmålene ens. Validitet betyder, at målingerne er gyldige og rensede for systematiske fejl - om vi måler det begreb, det drejer sig om (Malhotra 1996, 304-307). Vi har også valgt at give en oversigt over hvilke skalaer, der er brugt. Vi har undladt en systematisk gennemgang af spørgsmålenes konkrete indhold, da vi finder at dette må være op til læseren selv at opnå kendskab til spørgeskemaerne (se bilag 4.1, 4.2 og 4.3). Efter gennemgangen af telefonskemaet bør det bemærkes, at der i den følgende gennemgang er et overlap mellem mandens og kvindens spørgeskemaer, således at vi først gennemgår kvindens, og derefter de spørgsmål fra mandens spørgeskema som ikke er med hos kvinden. Vi forudsætter, at de kritikpunkter, der er i forbindelse med de enkelte spørgsmål til kvinden, også gælder for de samme spørgsmål til manden.

4.2 Reliabilitet og validitet

Reliabilitetsproblemer i spørgeskemaerne (se bilag 4.4 for specifik gennemgang af hvert enkelt spørgsmål) er egentlig, på trods af problemerne, begrænset til opfattelserne af begreber, som altid vil være subjektive (måleproblem). Der forekommer spørgsmål, som virker trivielle og et enkelt sted ikke entydigt. Entydigheden og et letforståeligt sprog er ellers en af de stærke sider ved skemaet. Enkelte spørgsmål bærer dog præg af, at man forudsætter et vist livsforløb, såsom at folk har et bestemt uddannelsesforløb og arbejde. Yderligere må man sætte spørgsmål ved, om respondenterne kan huske alt det, der spørges om, eller om svarene bliver givet på fornemmelse.

Validitetsproblemerne (se bilag 4.4) er relativt større end reliabilietsproblemerne. Generelt er det et problem med validiteten på grund af spørgeskemaernes længde. Det største problem opstår dog nok ved de fejlvurderinger, der må opstå - det kan i mange tilfælde ikke forudsættes, at respondenten ved noget om de ting, der bliver spurgt om. Hvis for eksempel kvinden ikke har deltaget aktivt i forbindelse med mandens sidste tøjkøb, kan man ikke forudsætte, at hun kan svare på mange af spørgsmålene, som knytter sig til denne proces. Man kan heller ikke forudsætte, at begge parter ved, hvad det er for et tøjkøb, der er blevet fortalt om i telefonsamtalen. Det må også være et problem at 27 ud af 118 kvinder, der har besvaret spørgeskemaet, har kendskab til et tøjmærke (JR), som ikke findes. I forbindelse med spørgsmål k25 kan man altid diskutere om det er et reliabilitets- (ikke kan huske det) eller validitets-problem (fejlvurderer - ikke ved det), at kvinden og manden ikke vurderer den samlede hustandsindkomst ens.

I bilag 4.4 har vi også vist, hvordan spørgeskemaets dele er skaleret. Disse skalaringer får vi senere brug for - bl.a. i afsnit 9, hvor analyseplanen opstilles.

5. Vurdering af indsamlingsmetoden

Vurdering af indsamlingmetoden har vi valgt at anskue ud fra et helhedsperspektiv - fra udvælgelsesproceduren til forundersøgelse (telefoninterview) og selve dataindsamlingen (spørgeskema). Her bruger vi Malhotras (1996) komparative sammenligning af faktorer, som har indflydelse på de forskellige metoder, der er anvendt. Derfor er både de positive og negative elementer søgt belyst i det følgende.

Fler-trins udvælgelsesproceduren via to-trins geografisk klyngeudvælgelse er nem og med til at reducere omkostningerne. Det skyldes, at processen er effektiv. Problemet er, at dette, jvfr. Malhotra (1996, 374-76), skal gøres, så de respektive klynger udgør en mini-skaleret repræsentation af stikprøverammen - homogenitet - mens der i selve klyngerne gerne skulle være heterogenitet mellem repsondenterne. Hvorvidt dette er tilfældet, foreligger der ikke nogle oplysninger om i opgaveformuleringen, men proceduren vil typisk være upræcis.

Indsamlingsmetoden er telefoninterview plus spørgeskema. De 500 udvalgte respondenter fra Odense vejviser kontaktes telefonisk og screenes ved telefoninterview. 148 tilkendegiver ønske om deltagelse i undersøgelsen. De informeres om tidspunkt for drop-off og gives instruktioner omkring udfyldningen. De udfyldte spørgeskemaer afhentes eller sendes i frankeret svarkuvert. 138 returnerer.

Indsamlingen foregår i følgende forløb: 1. Screening via telefon, 2. Spørgeskema. Punkt 2 kan deles op i: a)Aflevering personligt og b)Indsamling personligt/post.

Ad 1: Screening via telefon er en naturlig fremgangsmåde, der har den fordel, at meget field work sparres. Metoden er hurtig, giver god kontrol over population, data og dem, der indsamler dataene. Rimelig fleksibel i dataindsamlingen, men er til gengæld relativt dyr. Der kan i forbindelse med opkaldene være et problem, hvis man ikke kan få forbindelse til respondenten. Dette medfører nedsat effektivitet i forbindelse med dataindsamlingen. Der kan også være en tendens til ikke at svare helt ærligt i forbindelse med telefoninterview. I stedet for gives måske et socialt acceptabelt svar. Det kunne for eksempel være tilfældet i forbindelse med spørgsmålet:"Hvor stor en procentdel af husstandens samlede herretøjkøb købes i de nævnte butikstyper ?" Her vil en respondent, der fortrinsvist køber sit tøj i lavprisvarehuse, måske ikke stå ved dette, da det kan synes socialt uacceptabelt. En stor del af skylden bør lægges på anonymiteten, da denne ikke er så stor i forbindelse med et telefoninterview, men det betyder måske ikke så meget i forbindelse med de her brugte telefoninterviews, da de har form af en forundersøgelse (Malhotra 1996, 205-211).

Ad 2a: Spørgeskemaets omfang og sværhedsgrad taget i betragtning er det den bedste metode, der er valgt. Den personlige aflevering og instruktion vil også være med til at forøge responsraten blandt de respondenter, som over telefonen har tilkendegivet, at de vil være med. Responsraten forventes at være lav i forbindelse med postale spørgeskemaer, så på den måde er den personlige aflevering en god metode (Malhotra 1996, 210). Metoden sikrer også en optimal kontrol med stikprøveenheden. Det kan dog forekomme både dyrt (transport) og tidskrævende i forhold til et brevomdelt spørgeskema (Malhotra 1996; 207, 211).

Ad 2b: De to forskellige metoder, hvorved respondenterne kan returnere besvarelserne, har hver sine fordele og ulemper. Postmetoden er nem, billig og giver høj form for anonymitet. Den giver dog en lav kontrol, og man må forvente en relativ mindre responsrate end den personlige indsamling. Omkring hastigheden for svar må den postale forventes at være langsommere end den personlige afhentning. Det skyldes, at den personlige afhentning vil motivere respondenten til en besvarelse indenfor den givne tidsfrist. Omvendt tager det tid og er relativt dyrere at afhente personligt (personlig transport) - specielt hvis respondenterne ikke har udfyldt spørgeskemaerne på det tidspunkt, hvor afhentning finder sted. Det værste er dog, at anonymiteten er lav ved personlig afhentning. Dette kan påvirke respondentens svar i forbindelse med følsomme spørgsmål.

Alt i alt må indsamlingsmetoden, bortset fra den personlige afhentning, siges at være god. Den er ikke den billigste metode, men omstændig på en positiv måde, da den må give en højere responsrate og bedre kontrol end for eksempel ren postal omdeling til de 500 tilfældigt udvalgte.

6. Dataforberedelse

Malhotra (1996, 473) giver en oversigt over, hvordan en dataforberedelsesproces kan forløbe stringent (se bilag 6.1). De første trin går med at forberede spørgeskemaet, checke det, rette til, kode det, indsamle data og transcribere dem. Alle disse trin har vi i forbindelse med opgaven ikke haft indflydelse på, da det er et færdigt datasæt, vi arbejder med. De tre sidste trin i dataforberedelses processen omhandler rensning af data, statistiske justeringer af dataene og en dataanalysestrategi. I forbindelse med rensning af data har vi valgt ikke at rense de data vi har til rådighed, da de for så vidt er brugbare. Malhotra finder, at der i arbejdsprocessen med dataene vil forekomme justeringer, herunder statistiske justeringer, hvilket vi også anvender (Malhotra 1996, 272). Af de statistiske justeringer anvendes for eksempel skalatransformation (rekodning) i det næste afsnit om repræsentativitet - afsnit 7. Dataanalysestrategien er en del af afsnit 9.

7. Repræsentativitet

Er datamaterialet udvalgt fra Odense vejviser med en svarprocent på 27,8% (se bilag 7.1) repræsentativt for populationen - samlevende danske mænd og kvinder, hvor manden er 20-50 år? Umiddelbart kan man nok sætte spørgsmålstegn ved om Odense er repræsentativ for Danmark, ikke at forglemme alle de folk uden telefon eller med mobiltelefon som ikke er med stikprøverammen. Alligevel har vi testet repræsentativiteten på vores data. Ved test af repræsentativiteten bruges alderen fordelt på køn som test. Vi har testet for skævvridninger indenfor stikprøveenheden (Odense) og generaliserbarheden i forhold til populationen (Danmark). Grunden til, at vi har brugt alderen, er, at det er en variabel, som vi anser for værende betydende for repræsentativiteten og for vores problemstilling. Ligeledes har det været en variabel, som det har været muligt at fremskaffe sammenlignelige oplysninger om. Indkomst er en variabel vi kort drager sammenligning på for både Odense og Danmark, ligesom vi til sidst knytter en kommentar til postnummeret. Det kunne derudover have været relevant at teste på både mandens og kvindens beskæftigelsessituation, eller uddannelsesmæssige baggrund, men vi har her fundet det statistiske materiale utilstrækkeligt.

7.1 Test af skævridning

Når vi betegner det som test for skævvridning, mener vi, om dataene fordelt på køn og alder er repræsentative for Odense, hvor undersøgelsen er foretaget, eller om der er forekommet en skævvridning mellem dataene og stikprøverammen. Da spørgeskemaundersøgelsen blev udført i 1996, er der sammenlignet med tal fra 1996. For vores ²-test opstillede vi følgende hypoteser:

H₀: Repræsentativ og H_A: Ikke repræsentativ (²-testen gennemgås i afsnit 8.2). Ud fra stikprøven holdt op imod tilgængeligt statistisk materiale (Statitisk årbog 1996 - Odense Kommune) testede vi på et 0,05 signifikansniveau, og jævnfør bilag 7.2 fandt vi:

Tabel 7.1: ²-test, Odense

Køn Mand Kvinde

Asymp. signifikans 0,119 0,000

Test på H₀ Accept (ikke forkast) Forkast

Kilde: Bilag 7.2

Ud fra dette kan man ikke afvise, at mændene er repræsentative for stikprøverammen - man må altså acceptere, at de er repræsentative. Derimod kan man konkludere det modsatte for kvinderne - de er ikke repræsentative for stikprøverammen . For kvinderne skyldes det til dels, at deres aldersinterval (bilag 7.2) er udvidet i forhold til mændenes, fordi enkelte af mændenes partnere naturligt nok faldt udenfor mændenes aldersinterval. Således var der to 18-årige piger med i undersøgelsen, som blev placeret i deres eget aldersinterval (15-19).

7.2 Test af generalisering

Ved generalisering forstås dataenes anvendelighed på landsplan - og det er hele landet, der er populationens ramme. Dette svarer til en test af den eksterne validitet, der omhandler, hvorvidt resultaterne i den endelige analyse kan generaliseres til populationen (Malhotra 1996, 240-41). Da spørgeskemaundersøgelsen blev udført i 1996, men vi ønsker at generalisere og drage konklusioner i 1998, er de seneste tal (1997) valgt som sammenligningsgrundlag. Ud fra stikprøven holdt op imod tilgængeligt statistisk materiale (Statitisk årbog 1997 - Odense kommune), testede vi igen på et 0,05 signifikansniveau, og jævnfør bilag 7.2 fandt vi:

Tabel 7.2: ²-test på alder, Danmark

Køn Mand Kvinde

Asymp. signifikans 0,338 0,000

Test på H₀ Accept (ikke forkast) Forkast

Kilde: Bilag 7.2.

Hvis man ved indkomsten sammenligner en krydstabulering af stikprøven (køn, alder, indkomst) med gennemsnitlig bruttoindkomst pr. person fordelt på aldersgrupper og køn i 1995 (Statistisk Årbog 1997), får man næsten samme indkomstfordeling, samt gennemsnitlig indkomst ved en tilnærmet gennemsnitsberegning af indkomsten for stikprøveenheden i Odense. Dette gælder for både mænd og kvinder, hvilket tyder på repræsentativitet. Ser man på Danmark og den eksterne validitet, er den knap så repræsentativ med hensyn til den gennemsnitlige indkomst. For eksempelvis fandt vi for mænd følgende:

Tabel 7.3: Sammenligning af gennemsnitlig indkomst, mænd

Enhed Stikprøve (20-50 år)¹ Odense (15-54 år) Danmark (15-54 år)

Gns. indkomst d.kr. Ca. 227.000 221.000 168.000

Kilde: Statistisk årbog 1997 - Note 1: Indkomstintervallerne bliver transformerede til faste tal fx: 50.000 - 99.999 kr. = 75.000 kr.

Med hensyn til postnummer erfarede vi en stor overvægt i respondenter med postnr. 5220 Odense SØ (23,3%) i forhold til fordelingen for Odense pr.1.1.1997 i Statistisk Årbog 1997 (8,7%). Hvor vidt det så fortæller noget om respondenternes adfærd omkring herretøj, vil vi lade stå hen i det uvisse, men man kunne forestille sig, at visse befolkningsgrupper i de forskellige postnummerområder i Odense har en adfærd, der adskiller sig fra hinanden - eksempelvis et mondænt kvarter som Fruens Bøge og et mere tværkulturelt kvarter som Vollsmose.

Sammenfattende må vi konkludere, at stikprøven kun er repræsentativ for mænd. Dette gælder både med hensyn til Odense og Danmark. Ingen af delene er tilfældet for kvinder. På den eksterne validitet er der udover problemerne med kvinder på aldersvariablen også et repræsentativitets problem ud fra indkomst generelt.

Tilbage til startsiden. Frem til Del C: Analyseteknikker og analyseplan.

Køn	Mand	Kvinde
Asymp. signifikans	0,119	0,000
Test på H₀	Accept (ikke forkast)	Forkast

Enhed	Stikprøve (20-50 år)¹	Odense (15-54 år)	Danmark (15-54 år)
Gns. indkomst d.kr.	Ca. 227.000	221.000	168.000