Tiedot

Onko kysymysten sanamuotovaikutuksen suuruus aihekohtainen mitattaessa mieltymyksiä?

Onko kysymysten sanamuotovaikutuksen suuruus aihekohtainen mitattaessa mieltymyksiä?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Luin juuri abortin laillistamisesta tehdyssä kyselyssä:

Vastaukset riippuivat vahvasti kysymyksen sanamuodosta.

Mutta olen nähnyt myös tapauksia, joissa kysymyksen sanamuoto on suurelta osin merkityksetön. Niin kauan kuin ei ole tahallisia "johtavia" lauseita tai yleisiä virheitä, kuten epäselvyyttä, vastaajat todennäköisesti vastaavat samalla tavalla kysymyksiin, joilla on samanlainen sisältö.

Arvaukseni perustuu henkilökohtaiseen kokemukseen muista kuin kyselytutkimuksista, että kysymyksissä, joissa ihmiset ovat jo muodostaneet vahvan asenteen aiheeseen, nykyisten asenteiden mukainen sanamuoto saa aikaan enemmän yhteisymmärrystä ja sanamuoto, joka merkitsee erimielisyyttä, saa aikaan enemmän erimielisyyttä. Mutta tapauksissa, joissa ihmisillä ei vielä ole asenteita, kysymyksen sanamuoto ei ole niin tärkeä. Mutta tämä on vain arvaus, en ole koskaan nähnyt siitä tietoja.

Onko olemassa hyvä tieteellinen yleiskatsaus tekijöihin, jotka määrittävät kysymyksen aiheen, vastaajan (olipa hänen asenteensa tai muut ominaisuutensa) välisen suhteen ja todennäköisyyden, että kysymyksen sanamuodon ero aiheuttaa vastauseron?


Itseraportointimenetelmät olivat yksi valintakoe-aiheistani sosiaali- ja persoonallisuuspsykologian tohtorikoulutettavana, joten minulla on paljon viitteitä tarjottavana, mutta myönnän, etten ole lukenut suurinta osaa niistä (jos ollenkaan) ), ja olen unohtanut, mistä olen lukenut osan tästä. Se on todellakin hyvin laaja aihe, joten en luettele suurinta osaa tiedostani, jotka voisivat olla merkityksellisiä täällä, mutta voin luultavasti tarjota enemmän tietyistä ala -aiheista pyynnöstä.

Vastaajien ominaisuuksien ja vastausvirheiden välillä on hyvin monia suhteita, jotka riippuvat kyselyn suunnittelusta. Olisi käytännössä mahdotonta kuvitella, jos aihe ei olisi joillekin niistä hillitsevä tekijä. Erityisesti sosiaalinen toivottavuus on eräänlainen puolueellisuus, joka riippuu suuresti kyselyn suunnittelusta, osallistujaominaisuuksista ja tutkittavasta aiheesta. Wikipedia tarjoaa melko hyvän intro-tason yhteenvedon:

Suuntaus aiheuttaa vakavan ongelman tutkimuksen tekemisessä itseraportit, erityisesti kyselylomakkeet. Tämä harha häiritsee keskimääräisten suuntausten ja yksilöllisten erojen tulkintaa.

Aiheet Jos sosiaalisesti toivottava reagointi (SDR) on erityisen huolestuttavaa, raportoidaan itse kykyjä, persoonallisuutta, seksuaalista käyttäytymistä ja huumeiden käyttöä. Kun he kohtaavat esimerkiksi kysymyksen "Kuinka usein masturboit?", Yhteiskunnallinen tabu voi painostaa vastaajia itsetyydytystä vastaan, ja he voivat joko ilmoittaa usein esiintymistiheydestä tai välttää vastaamista kysymykseen. Siksi itsestään raportoiduista kyselyistä saadut keskimääräiset itsetyydytysasteet ovat todennäköisesti vakavia aliarviointeja.

Kun kohtaat kysymyksen "Käytätkö huumeita/laitonta aineita? "vastaaja voi vaikuttaa siihen, että valvottavat aineet, mukaan lukien yleisemmin käytetty marihuana, ovat yleensä laitonta. Vastaajat saattavat tuntea painostusta kieltää huumeidenkäytön tai järkeistää sen, esimerkiksi "poltan marihuanaa vain ystävieni läheisyydessä". Poikkeama voi myös vaikuttaa raportteihin seksikumppaneiden määrä. Itse asiassa bias voi toimia vastakkaisiin suuntiin eri alaryhmille: Kun miehet pyrkivät lisäämään lukuja, naiset aliarvioivat omat. Kummassakin tapauksessa molempien ryhmien keskimääräiset raportit vääristyvät todennäköisesti sosiaalisen toivottavuuden harhaa.

Muita aiheita, jotka ovat herkkiä sosiaalisen toivottavuuden harhaa:

  • Henkilökohtaiset tulot ja ansiot, jotka usein nousevat alhaisina ja deflatoituvat korkeina.
  • Alhaisen itsetunnon ja/tai voimattomuuden tunteet, jotka usein kielletään.
  • Erittymistoiminnot, joita lähestytään usein epämukavasti, jos niistä keskustellaan ollenkaan.
  • Lääkkeiden annosteluaikataulujen noudattaminen, usein täytetty.
  • Uskonto, usein joko vältetty tai epämiellyttävä lähestymistapa.
  • Isänmaallisuus, joko puhallettu tai, jos se kielletään, on tehty peläten toisen osapuolen tuomiota.
  • Kiusaamista ja suvaitsemattomuutta, usein kielletään, vaikka se olisi vastaajan sisällä.
  • Älylliset saavutukset, usein paisuneet.
  • Fyysinen ulkonäkö, joko täytetty tai tyhjennetty
  • Todellisen tai kuvitellun fyysisen väkivallan teot, jotka usein kielletään.
  • Hyväntekeväisyyden tai "hyväntahtoisuuden" indikaattorit ovat usein paisuneet.
  • Laittomat teot, usein kiistetty.
    [Painotus lisätty.]

Kiistanalainen poikkeus toiseksi viimeiseksi esiintyy Smithissä (1987): ihmiset reagoivat vähemmän anteliaasti ja kielteisemmin "hyvinvointiin" kuin "köyhät".

Wikipedia mainitsee yhden monista sosiaalisesti toivottavan reagoinnin mittareista, mutta huomauttaa:

Suurin huolenaihe SDR -asteikolla on se, että ne sekoittavat tyylin sisältöön. Loppujen lopuksi ihmiset todella eroavat toisistaan ​​siinä määrin, jolla heillä on haluttuja piirteitä (esim. Nunnat vs. rikolliset).

Toinen huolenaihe on sosiaalisen toivottavuuden mahdollisen moniulotteisuus. Jotkut syntyvät tietoisesti petollisessa vastaamisessa; toinen laji syntyy tiedostamattomasta itsensä pettämisestä. Näiden sosiaalisen toivottavuuden harhaluulojen laajuus voi riippua eri tavalla vastaajien yksilöllisistä eroista sekä kysymyksen aiheesta ja sanamuodosta.

Wikipedia antaa myös lyhyen yleiskuvan muista vastaustyyleistä, mukaan lukien äärimmäinen vastaustyyli, joka liittyy demografisiin (Song, 2007) ja persoonallisuuden (Hamilton, 1968) tekijöihin. Päinvastainen tyyli, taipumus neutraaliin / "en tiedä" -vastaukseen voi johtua henkilökohtaisesta epävarmuudesta, kohteen vaikeudesta tai aiheen herkkyydestä (Coombs & Coombs, 1976), joten tämä näyttää olevan melko täydellinen esimerkki eräästä puolueellisuudesta, joka riippuu kaikista kolmesta tekijästä. Toinen näistä vastaustyyleistä, hyväksyminen (ja päinvastoin), on jokseenkin mielenkiintoinen persoonallisuuden muuttuja itsessään (Couch & Keniston, 1960); sen vaikutusta voidaan rajoittaa välttämällä "samaa vastaan ​​vs. eri mieltä" -muotoa, mutta tämä voi olla vaikeampaa asennetutkimuksessa kuin joissain muissa aiheissa.

Tämän alapuolella Wikipedia mainitsee, että nimettömyys, luottamuksellisuus ja neutraloitu hallinto voivat vähentää sosiaalisen toivottavuuden harhaa, joten tässä mielessä kysymyksen ulkopuoliset asiayhteyteen vaikuttavat tekijät voivat vaikuttaa puolueellisuuteen, erityisesti silloin, kun muiden (esim. Vanhemmat, ikätoverit, työnantajat, laki) täytäntöönpano) on huolestuttavaa (esim. autoritaaristen vanhempien lapset, tuomitsevien ihmisten ystävät, työnhakijat, jotka joutuvat persoonallisuustestien kohteeksi, ehdonalaiset ja aikaisemmin tuomitut).

Eräs erittäin hyvä arvosteluartikkeli, joka minulla on käsillä (Schwarz, 1999), käsittelee kysymyksiä "sanamuoto, muoto ja konteksti", mukaan lukien:

  • Epäselvyys, hämärtyminen ja sananvapaus
  • Avoin vastaaminen (ks. Myös Geer, 1988) vs. taajuusraportointi ja nimikkeiden luokitus
  • Ajankohtainen subjektiivisuus, asiantuntemuksen kysyntä ja aikariippuvuus

Koska tämä artikkeli on arvostelu, voit löytää myös paljon muita viittauksia sen kautta. Toinen katsausartikkeli, joka saattaa kiinnostaa muita täällä, liittyy kyselyn mittausongelmiin kognitiivisiin ongelmiin, kuten muistiin, ymmärrykseen ja kaavojen valmisteluun (Jobe & Mingay, 1991), joista jokainen olisi helposti nähtävissä enemmän tai vähemmän relevanttina tietyissä yhteyksissä ja tietyille ihmisille tavalla, joka riippuu siitä, miten kysymys on muotoiltu. Jälleen toinen valtava viiteosa, joka on louhittava tarkempia yksityiskohtia varten. Vielä yksi katsaus (Nisbett & Wilson, 1977) koskee nimenomaan virheitä (ei välttämättä systemaattista harhaa) itseraportoiduissa mielenterveyden prosesseissa, jotka johtuvat rajoitetusta itsetuntemuksesta / näkemyksestä ja aikaisempien teorioiden tai uskottavuuden arvioiden vaikutuksesta. Hyvä asia tuoda esille täällä, jos itse sanon niin!

Viitteet

Coombs, C. H., & Coombs, L. C. (1976). ”En tiedä” -kohteen epäselvyys tai vastaajan epävarmuus ?. Yleinen mielipide neljännesvuosittain, 40(4), 497-514.

Couch, A., & Keniston, K. (1960). Vuosimiehet ja naysayers: Hyväksyttävä vastaus asetettu persoonallisuuden muuttujaksi. Journal of Epänormaali ja sosiaalipsykologia, 60(2), 151-174.

Geer, J. G. (1988). Mitä avoimet kysymykset mittaavat? Yleinen mielipide neljännesvuosittain, 52(3), 365-367.

Hamilton, D.L. (1968). Äärimmäiseen vastaustyyliin liittyvät persoonallisuusominaisuudet. Psykologinen tiedote, 69(3), 192-203.

Jobe, J. B. ja Mingay, D. J. (1991). Kognitio ja mittaus: Historia ja yleiskatsaus. Sovellettu kognitiivinen psykologia, 5(3), 175-192.

Nisbett, R. E., & Wilson, T. D. (1977). Kerro enemmän kuin voimme tietää: Sanalliset raportit henkisistä prosesseista. Psykologinen katsaus, 84(3), 231-259. Saatavana verkossa, URL: http://www.apologeticsinthechurch.com/uploads/7/4/5/6/7456646/nisbettwilson.pdf. Haettu 5. helmikuuta 2014.

Schwarz, N. (1999). Itseraportit: Kuinka kysymykset muokkaavat vastauksia. Amerikkalainen psykologi, 54(2), 93-105. Saatavana verkossa, URL: https://edit.ethz.ch/oat/education/material/material_06_07/material_empirical_methods_06_07/American_Psychologist_Self-Reports.pdf.

Smith, T. W. (1987). Se, mitä me kutsumme hyvinvoinniksi millä tahansa muulla nimellä, tuoksuu makeammalta: Analyysi kysymyksen sanamuodon vaikutuksesta vastausmalleihin. Julkinen mielipide neljännesvuosittain, 51(1), 75-83.

Laulu, X.-Y. (2007). Analyysi useista yksinkertaisista rakenneyhtälömalleista, joissa on sovelluksia elämänlaatutietoihin. Julkaisussa S.-Y. Lee (toim.), Käsikirja piilevistä muuttujista ja niihin liittyvistä malleista, s. 279-302. Pohjois-Hollanti.


Arviointikysymys: Asenteiden mittausmenetelmä ☆

Tässä artikkelissa esitetään EQA (Evaluation Question Approach), jolla voidaan mitata asennetta sosiaalisiin ja taloudellisiin kysymyksiin kognitiivisen arvioinnin puitteissa. EQA: n perusajatus on, että vastaajalle tarjotaan sanallisia arviointitarroja, jotka sitten yhdistävät kyseessä olevan kohteen kuvauksen tai ilmentymän. Sen sijaan, että se toimittaisi ärsykkeitä vastaaville tunteille, kuten psykofyysisiä menetelmiä käytettäessä, tarkasteltava lähestymistapa toimii päinvastoin. Sitä voidaan pitää vastakohtana vinjettitekniikalle, jolla metodologisesti perustuva vertailu tehdään. Sanallisia tarroja tutkitaan, jos eri vastaajat tulkitsevat niitä muuten. Tätä tärkeää skaalausongelmaa sovelletaan vuoden 1983 Bostonin (USA) tietojoukkoon, jossa on noin 500 vastaajaa. Tämän empiirisen testin tulos tukee oletusta, että tulkintaeroja ei ole. Yhteenvetona voidaan todeta, että EQA näyttää olevan elinkelpoinen yleinen menetelmä, ja sitä voidaan soveltaa useisiin aiheisiin kaikissa käyttäytymistieteissä.

Kirjoittajat haluavat ilmaista kiitollisuutensa Steven Dubnoffille, Massachusettsin yliopistosta Bostonista, joka loi tietojoukon National Science Foundationin taloudellisella tuella. He haluavat myös kiittää kahta anonyymiä erotuomaria arvokkaista näkemyksistään. Tekijät ovat luonnollisesti vastuussa kaikista jäljellä olevista virheistä ja ilmaisemista mielipiteistä.


Achen, Christopher H. (1975). "Joukkopoliittiset asenteet ja kyselyvastaus."American Political Science Review 69:1218–31.

Backstrom, Charles H. ja Gerald Hursh-Cesar (1981).Kysely tutkimus. New York: Wiley.

Bem, Daryl J. (1978). "Itsetuntoteoria." Julkaisussa Leonard Berkowitz, toim.Kognitiiviset teoriat sosiaalipsykologiassa. New York: Academic Press.

Piispa, George F., Robert W. Oldendick ja Alfred J. Tuchfarber (1978). "Muutos amerikkalaisten poliittisten asenteiden rakenteessa: kysymyksen sanamuoto."American Journal of Political Science 22:250–69.

Poliittisten opintojen keskus (1972).CPS 1970 American National Election Study. Ann Arbor, Mich .: Yliopistojen välinen poliittisen tutkimuksen konsortio, Michiganin yliopisto.

—— (1977).CPS 1976 American National Election Study: Volume II. Ann Arbor, Mich .: Yliopistojen välinen poliittisen ja sosiaalisen tutkimuksen yhteenliittymä, Michiganin yliopisto.

—— (1979).American National Election Study, 1978: osa II. Ann Arbor, Mich .: Yliopistojen välinen poliittisen ja sosiaalisen tutkimuksen yhteenliittymä, Michiganin yliopisto.

Converse, Philip E. (1970). "Asenteet ja ei-asenteet: vuoropuhelun jatkaminen." Pp. 168–189, julkaisussa Edward R. Tufte, toim.Sosiaalisten ongelmien kvantitatiivinen analyysi. Lukeminen, massa: Addison-Wesley.

Davis, James A. (1974). "Hierarkiset mallit merkittävyystesteille monimuuttujataulukoissa." Pp. 189–231, julkaisussa Herbert L.Costner, toim.Sosiologinen metodologia 1973–1974. San Francisco: Jossey-Bass.

Erbring, Lutz, Edie N. Goldenberg ja Arthur H.Miller (1980). "Etusivun uutiset ja tosielämän vihjeet: Median uusi näkemys esityslistan asettamisesta."American Journal of Political Science 24:16–49.

Lodge, Milton ja Bernard Tursky (1979). "Vertailu SRC/CPS -kohteita käyttävien poliittisten mielipiteiden luokkien ja suuruusluokkien välillä."American Political Science Review 73:50–66.

Loftus, Geoffrey R. ja Elizabeth F.Loftus (1976).Ihmisen muisti: Tietojen käsittely. New York: Wiley.

Margolis, Michael (1977). "Hämmennyksestä hämmennykseen: ongelmat ja amerikkalainen äänestäjä, 1956–1972."American Political Science Review 71:31–43.

Miller, Warren E., Arthur H. Miller ja Edward J. Schneider (1980).American National Election Studies Data Sourcebook, 1952–1978. Cambridge: Harvard University Press.

Nie, Norman N., Sidney Verba ja Joan R.Petrocik (1979).Muuttuva amerikkalainen äänestäjä. Cambridge, Massa .: Harvard University Press.

Nisbett, Richard ja Lee Ross (1980).Inhimillinen vaikutus: sosiaalisen tuomion strategioita ja puutteita. Englewood Cliffs, NJ: Prentice-Hall.

Page, Benjamin, I. ja Calvin C. Jones (1979). "Poliittisten mieltymysten, puolueiden uskollisuuksien ja äänestyksen vastavuoroiset vaikutukset."American Political Science Review 73:1071–89.

Shaw, Donald L. ja Maxwell E.McCombs (1977).Amerikan poliittisten kysymysten syntyminen: Lehdistön esityslistan asetus. Paul, Minn .: West Publishing Co.

Smith, Eric R.A.N. (1980). "Käsitteellistymisen tasot: ideologisen hienostuneisuuden vääriä mittauksia."American Political Science Review 74:685–96.

Smith, Tom W. (1981). "Voimmeko luottaa luottamukseen? Käytiin uudelleen. ” Julkaisussa Denis F.Johnston, toim.Alistuvien ilmiöiden mittaus. Washington, DC: Yhdysvaltain hallituksen painotoimisto.

Sudman, Seymour ja Norman M.Bradburn (1974).Response Effects in Surveys: Katsaus ja yhteenveto, Chicago: Aldine.

Sullivan, John L., James E.Piereson ja George E.Marcus (1978). "Ideologinen rajoitus yleisössä: metodologinen kritiikki ja joitain uusia havaintoja."American Journal of Political Science 22:233–49.

- (1979). "Vaihtoehtoinen poliittisen suvaitsevaisuuden käsite: kuvitteelliset lisäykset, 1950--1970-luvut."American Political Science Review 73:781–94.

Survey Research Center (1971).Survey Research Center 1958 -vaalitutkimus. Ann Arbor, Mich .: Yhteiskuntatutkimuslaitos, Michiganin yliopisto.

Taylor, Shelley E. ja Susan T.Fiske (1978). "Merkityksellisyys, huomio ja vaikuttavuus: huippuilmiöitä." Pp. 249–288, julkaisussa Leonard Berkowitz, toim.Advances in Experimental Social Psychology, Voi. II. New York: Academic Press.

Turner, Charles F. ja Elissa Krauss (1978). "Kansan subjektiivisen tilan virheelliset indikaattorit."Amerikkalainen psykologi 33:456–470.


Ketä haastatella

Aloitan tämän osan keskustelulla näytteenotosta. Kun teet kyselyä, on tärkeää valita edustava joukko yksilöitä kankaille. Koko Yhdysvaltojen väestönlaskennan tekeminen on sekä kohtuuttoman kallista että tarpeetonta. Sen sijaan kyselytutkijat valitsevat otoksen kiinnostavasta väestöstä (täällä Yhdysvaltojen asukkaat).

Tekniseltä kannalta oikea tapa ottaa tällainen näyte on yksinkertaisen satunnaisotannan (SRS) avulla. Yksinkertaisilla satunnaisnäytteillä on kaksi tärkeää ominaisuutta: Jokainen yksilö valitaan otokseen sattumanvaraisesti, ja jokaisella populaation jäsenellä on yhtäläinen mahdollisuus päästä otokseen. Näissä olosuhteissa jokaisella mahdollisella tietyn kokoisella näytteellä on samat mahdollisuudet valita. Jokaisella Yhdysvaltojen asukkaalla on siis yhtäläinen mahdollisuus päästä kyselyyn. Mutta tämä teknisesti oikea menettely on käytännössä mahdoton toteuttaa tai ainakin mahdottoman kallis. Siksi tutkijat ovat aina jääneet tämän ihanteen alle. Sen sijaan harjoittajat ovat käyttäneet muita menetelmiä, jotka varmistavat edustavat näytteet.

Suurimman osan 1900-luvusta nämä menettelyt sisälsivät kasvotusten monivaiheiset mallit ja puhelinhaastattelut satunnaisvalinnalla (yleiskatsaus, katso Lohr 2010). Nämä menetelmät, vaikka eivät SRS, voidaan suorittaa tavoilla, joiden avulla tutkijat voivat lähentää SRS: ää. Tilastollisia menetelmiä on kehitetty ottamaan huomioon nykyaikaisen tutkimuksen otannan suunnittelukomponentit, kuten klusterointi ja kerrostuminen (Kish 1965, Lohr 2010).

Lisäksi tutkijat ja ammatinharjoittajat ovat kehittäneet menetelmiä otantaan otoksen ja näytteen keräämisen välisen epätasapainon huomioon ottamiseksi. Kaikki kyselyyn valitut vastaajat eivät suostu haastatteluun. Keskustelen tämän vastaamatta jättämisen vaikutuksista myöhemmin tässä artikkelissa, mutta toistaiseksi on tärkeää, että tutkijat ovat kehittäneet tapoja korjata tämä ongelma. Useimmissa tapauksissa meillä on vain vähän tietoa väestöstä (suhteessa otokseen) Yhdysvaltojen väestönlaskennasta kerättyjen tietojen muodossa. Näissä tapauksissa painotuksen oikaisuja käytetään tyypillisesti vähentämään harhaa, jota vastaus voi aiheuttaa kyselyarvioissa (Lohr 2010). Jos esimerkiksi kyselyn otoksessa on enemmän vanhoja vastaajia kuin väestössä, vanhoille vastaajille annetaan vähemmän painoarvoa ja nuorille vastaajille enemmän, joten mukautetun otoksen ikäjakauma vastaa väestöjakaumaa. Yksi tapa, jota tavallisesti käytetään näytteiden painottamiseen, on haravointi. Haravointi vastaa solumäärää painotusjärjestelmässä käytettyjen muuttujien marginaalijakaumiin. Muut tekniikat, kuten regressiopainotus ja taipumuspisteen painotus, hyödyntävät yksityiskohtaisempia tietoja. Lohr (2010) tarjoaa hyödyllisen yleiskuvan näistä eri painotusmenetelmistä (ks. Myös Lumley 2010).

Pollingin muuttuva maisema

Jos kirjoitan tämän artikkelin 20 vuotta sitten - tai jopa 15 vuotta -, tämä osio päättyy tähän. Otantamenetelmät kasvokkain ja puhelimitse olivat hyvin kehitettyjä, ja kyselytutkijat voisivat olla varmoja siitä, että heidän kyselyihinsä vastanneiden ryhmä edusti riittävästi koko Yhdysvaltain väestöä. Kysymys, ketä haastatella, esitettiin ja siihen vastattiin. Kuitenkin 1990 -luvulta lähtien ja erityisesti vuosisadan vaihteesta lähtien monet tapahtumat ovat saaneet äänestysalueen epäjärjestykseen. Mielipidekyselyiden edustavuus perustuu tutkijoiden kykyyn kommunikoida todellisesti otantamenettelyssään valitsemiensa vastaajien kanssa. Tästä on tullut ajan myötä yhä vaikeampaa.Mahdollisiin vastaajiin on yhä vaikeampi ottaa yhteyttä, ja kun tutkijat voivat ottaa yhteyttä tällaisten henkilöiden osajoukkoon, nämä mahdolliset vastaajat eivät todennäköisesti suostu osallistumaan kyselyihin.

Mielipidekyselyihin vastaamatta jättäminen alkoi kasvaa hälyttävästi 1990 -luvun lopulta lähtien. Sekä yhteydenpito- että yhteistyöasteet laskivat jyrkästi. Paras ylitietojen lähde tähän kysymykseen on Pew Center for the Study of the People and the Press, joka on julkaissut yksityiskohtaisia ​​lukuja kyvystään tavoittaa mahdolliset vastaajat lähes 20 vuoden ajan. Nämä tiedot esitetään Kuvio 1. Vuonna 1997 Pew pystyi ottamaan yhteyttä 90%: iin mahdollisista vastaajistaan, ja 43% näistä henkilöistä suostui vastaamaan kyselyyn, jolloin kokonaisvastausaste oli 36%. Vuoteen 2012 mennessä yhteydenpitoaste laski 62%: iin ja yhteistyöaste 14%: iin, jolloin vastausprosentti oli vain 9%. Nykyään yli yhdeksän kymmenesosaa mahdollisista vastaajista ei pääse otokseen yhdeksi parhaiten hoidetuista kyselytutkimuksista Yhdysvalloissa. Varmasti Pew: tä vähemmän ammattitaitoisten organisaatioiden vastausprosentti on vieläkin alhaisempi. 2

Muut teknologiset muutokset ovat häirinneet myös tutkimusalan tutkimusta. Yhä useammat amerikkalaiset ovat luopuneet lankapuhelimista matkapuhelinten hyväksi. Vuodesta 2003 lähtien Center for Disease Control and Preventionin kansallinen terveyshaastattelututkimus (NHIS) on mitannut vain soluja sisältävien kotitalouksien esiintyvyyttä Yhdysvalloissa. Tänä aikana vain langattoman puhelinpalvelun kotitalouksissa asuvien aikuisten osuus nousi 3 prosentista 48 prosenttiin (Blumberg & amp Luke 2016). Tämä viestintätekniikan muutos merellä on muuttanut perinteiset puhelinäänestykset. Matkapuhelinhaastattelut ovat kalliimpia kuin lankahaastattelut, koska maanmittareilla on laki (vuoden 1991 puhelinkuluttajansuojalaki, 47 U.S.C. 227) kielletty käyttämästä automaattisia soittajia, jotka tekivät puhelinhaastattelusta edullisen. Mutta on olemassa vakavampia ongelmia kuin liiketoiminnan kustannukset. Vaikka varhaiset tutkimukset olivat osoittaneet, että vain solutason kotitalouksiin liittymättä jättämisen aiheuttamia harhoja voitaisiin korjata painottamalla vain lankapuhelin otos, joka heijastaa väestön ominaisuuksia keskeisissä muuttujissa, kuten iässä ja rodussa (Brick et al. 2006, Keeter 2006) , vuoteen 2008 mennessä tämä ratkaisu näytti lakanneen toimimasta. Keeter et ai. (2008) havaitsivat, että lankapuhelinnäytteiden painottaminen väestön tunnettujen ominaisuuksien huomioon ottamiseksi ei voinut ottaa huomioon vain matkapuhelimen omaavien yksilöiden eri äänestysasetuksia. Yksilöt, joilla oli vain matkapuhelimet, olivat pohjimmiltaan erilaisia ​​kuin lankapuhelimia käyttävät henkilöt (ehdolliset väestötieteelliset toimenpiteet, kuten ikä ja rotu, jotka ovat tutkijoiden käytettävissä). Täten lankapuhelinvastaavien todennäköisyysnäytteet poissulkeivat erillisen osan väestöstä otantakehyksestä. Toisin sanoen pelkästään soluja sisältävien henkilöiden mielipiteet edustavat puuttuvia tietoja, joita emme voi helposti korvata. Muiden tieteenalojen tutkijat ovat tulleet samanlaisiin johtopäätöksiin (katso sivupalkki nimeltä Matkapuhelimen kattavuus ja kyselyt).

Sairauksien torjunnan ja ennaltaehkäisyn keskusten (CDC) kansallinen terveystilastokeskus vertasi National Health Interview Survey (NHIS) -tietoja vain lankapuhelimesta otetuista näytteistä "kaksikehyksisten" näytteiden tietoihin, jotka sisälsivät sekä solu- että lankapuhelintaloutta. He havaitsivat, että pelkän lankapuhelimen otoksen painottaminen väestönlaskennan väestötietojen mukaisesti tuotti puolueellisia arvioita väestön ominaisuuksista ja terveyskäyttäytymisestä (Blumberg & amp. Luke 2009). CDC on jopa ilmaissut huolensa suurimmasta käynnissä olevasta puhelinhaastatteluterveystutkimuksestaan, Behavioral Risk Factor Surveillance Systemistä. CDC: n tutkijat suorittivat rinnakkaisen vain solututkimuksen vuonna 2008 ja löysivät suuria eroja monien itse raportoitujen asenteiden ja käyttäytymisten välillä yhdistetyn näytteen ja vain lankapuhelimen otoksen välillä jopa painotuksen jälkeen (Hu et al. 2011).

Tämän seurauksena suuret tiedotusvälineet ja akateemiset organisaatiot ovat siirtyneet haastatteluun sekä lankapuhelimilla että matkapuhelimilla. Toistaiseksi ei kuitenkaan ole laajalti hyväksyttyä matkapuhelinmittauksen "parhaita käytäntöjä" (Lavrakas et al. 2010) eikä yksimielisyyttä siitä, miten matkapuhelin- ja lankapuhelinvastaajat voidaan parhaiten yhdistää yhdeksi otokseksi käyttämällä "kaksikehystä" ”Lähestymistavat (Lavrakas et al. 2010, josta keskustellaan tarkemmin, katso Brick et al. 2006, Kennedy 2007, Guterbock et al. 2011, Levine & amp; Harter 2015). Matkapuhelimet on sidottu yksilöihin, kun taas lankapuhelimet ovat kotitalouksissa. Näytteiden sekoittaminen näiden kahden tyyppisten kosketuspisteiden kanssa ei ole helppoa. Esimerkiksi monet ihmiset ovat tavoitettavissa sekä matkapuhelimella että lankapuhelimella. Molemmissa kehyksissä esiintyvillä henkilöillä on suurempi todennäköisyys osallistua.

Ehkä ajan myötä matkapuhelimien levinneisyys on riittävän laaja vastaamaan lankapuhelimien kattavuutta 1990-luvun alussa. Kuitenkin siihen päivään asti tie eteenpäin on epäselvä. Matkapuhelinten nousu uhkaa selvästi kyselyiden edustavuutta, mutta tähän ongelmaan ei ole ilmeisiä korjaustoimenpiteitä.

On erittäin vaikeaa määritellä kohderyhmä, jota haluaisimme edustaa otoksellamme. Hillygus (2016) huomauttaa aivan oikein, että ei ole olemassa luetteloa kaikista Internetin käyttäjistä, joihin voimme vedota puhelinnumeroiden luetteloa vastaavasti. Tämän seurauksena Internetin kautta tehtävää tutkimusta tehdään usein epätodennäköisyysnäytteillä (vaikka tietenkin, kuten muut kuin online-kyselyt eivät ole luontaisesti todennäköisyysnäytteitä, online-kyselyjen ei välttämättä tarvitse olla epäolennaisnäytteitä). Jotkut yritykset esimerkiksi ottavat näytteitä vapaaehtoisten verkkopaneeleista. Nämä näytteet mukautetaan sitten väestön arvioimiseksi eri tavoilla, mukaan lukien kiintiönäyte väestönlaskennan väestötietojen vastaamiseksi, mallipohjainen taipumus vastaavuuteen ja jälkitutkimuksen säätö jollakin painotustekniikalla (Baker et al. 2010). Keskeinen asia on kuitenkin se, että riippumatta siitä, mitä mekanismia käytetään, näitä Internet -paneelien näytteitä ei voida pitää samankaltaisina kuin satunnaisnäytteitä. American Association for Public Opinion Research (AAPOR) -työryhmä - johtava kyselytutkimuksen tutkijoiden ja harjoittajien järjestö - totesi, että "tällä hetkellä ei ole yleisesti hyväksyttyä teoreettista perustetta, jonka perusteella voidaan väittää, että tutkimustulokset, joissa käytetään näytteitä ei -todennäköisyyteen liittyvistä verkkopaneeleista, ovat suurelle yleisölle ”(Baker et al. 2010, s. 758). Huolimatta lupaavasta työstä tällä alalla (Gelman ym. 2016), AAPOR -raportin julkaisemisesta kuluneiden kuuden vuoden aikana tästä asiasta ei ole päästy yksimielisyyteen. 3

Mitä tulevaisuus tuo tullessaan?

Vaikka tie eteenpäin on epäselvä, kyselyt eivät mene minnekään, ne ovat edelleen poliittisen järjestelmän kriittinen osa. Päättäessään kyselynsä tutkimuskyselyn historiasta Yleinen mielipide neljännesvuosittainSeitsemänkymmenenviidennen vuosipäivän numerossa Robert Groves (2011, s. 870) toteaa oikein: ”Kyselytutkimus ei kuole, se muuttuu.” Kun teollisuus kamppailee selvittääkseen, kuinka kerätä näytteitä vastaajista nykymaailmassa, jotkut perustiedot on tunnistettava ja harkittava huolellisesti, kun määritetään, kuinka parhaiten rakentaa otos ihmisten tahdon arvioimiseksi. Seuraava ehdotussarja tarjoaa toivottavasti tuottavan lähtökohdan ajatella, miten parhaiten voidaan ottaa näytteenottoa täsmällisesti.

Ensinnäkin voi olla hyödyllistä ajatella kyselyitä tällä hetkellä vaivaavia puuttuvia tietoja koskeviksi ongelmiksi. Keskeinen haaste haastateltavien valitsemisessa on minimoida erot kysymyksiemme ja kaipaamiemme ihmisten välillä. Esimerkiksi perusongelma lankapuhelimien käytön jatkamisessa otantatutkimuksen vastaajiin on, että valtaosa ihmisistä, joiden pitäisi kuulua otokseen, ei ole otoksessamme - joko siksi, että emme voi tavoittaa heitä tai koska he kieltäytyvät vastaamasta kysymyksiimme, kun ota heihin yhteyttä. Tästä näkökulmasta oikea tapa korjata ongelma on pohtia, kuinka tavoittamamme ihmiset eroavat ihmisistä, joita emme voi tavoittaa - ja ottaa nämä erot huomioon painotuksen avulla. Voimme mukauttaa otoksiamme, mutta saadaksemme tarkan kuvan julkisesta tahdosta meidän on mitattava tiettyjen kyselyiden vastaajien ja vastaamattomien erot. Jos emme tee niin, arviomme yleisön tahdosta on väärä-kuten se, että painotus ei korjaa pelkästään solua koskevaa harhaa vuoden 2004 jälkeen, osoittaa. Tämä huolenaihe on erityisen tärkeä, koska painotukseen käytetyt apumuuttujat valitaan usein mielivaltaisesti niiden saatavuuden perusteella sekä tutkimuksissa että tietojoukkoissa, jotka mittaavat väestön ominaisuuksia - kuten ikää ja sukupuolta - riippumatta siitä, vähentävätkö ne todellisuudessa arvioidemme harha. Se, että Yhdysvalloilla on suhteellisen harva kokoelma julkisesti saatavilla olevia väestötason väestötietoja (Massey & amp Tourangeau 2013), osoittaa, että painotusongelma ei poistu lähiaikoina.

Toiseksi todennäköisyys- ja epätodennäköisyysnäytteet ovat pohjimmiltaan erilaisia, ja vastausten keräämismenetelmiä verrattaessa on otettava huomioon useita tekijöitä. On tärkeää tunnistaa nämä erot edelleen, myös aikakaudella, jolloin todennäköisyysvaste romahtaa pieniin yksittäisiin numeroihin. Kuten Brick (2011, s. 876) toteaa, "[A] yleinen pidätys on, että todennäköisyysnäyte, jolla on alhainen vastausprosentti tai kattavuus, ei ole" parempi "kuin ei -todennäköinen tai vapaaehtoinen otos." Mutta tämä näkökulma ei ehkä ole tarkka. Se, että kyselyllä on alhainen vastausprosentti - jopa häviävän alhainen vastausprosentti - ei tarkoita, että se olisi pohjimmiltaan virheellinen. Itse asiassa se voi olla parempi kuin epätodennäköisyysnäyte, joka näyttää enemmän populaatiolta määrien perusteella, joita voimme mitata. Todennäköisyysnäytteet on rakennettu vahvalle päättelypohjalle, koska riippumatta siitä, kuinka alhainen vastausprosentti on, kaikki otokseen valitut yksiköt rekrytoidaan aktiivisesti ja heitä kannustetaan osallistumaan kyselyyn. Tämä ei pidä paikkaan, joka ei ole todennäköinen. Toisin sanoen, on ero sen välillä, että tulen luoksesi tutkijana ja pyydän sinua osallistumaan kyselyyn ja sinä tulet luokseni vastaajana ja pyydät minua olemaan osa tutkimustani. Se, että verkkopaneelit voivat sisältää ”ammattimaisia” vastaajia, jotka haluavat tehdä useita kyselyitä rahan ja muiden kannustimien vuoksi (Hillygus et al. 2014), korostaa tätä ongelmaa. Ellemme pysty mittaamaan tarkasti eroja, jotka johtavat itsevalintakäyttäytymiseen epätodennäköisyysnäytteissä, emme voi ottaa huomioon näitä eroja. Tästä huolimatta laskevat vastausprosentit ovat selvästi huolestuttavia, ja todennäköisyys- ja ei -todennäköisyysnäytteenottojen suhteellisista eduista olisi keskusteltava jatkuvasti - mutta sen on oltava keskustelu, joka perustuu sekä perinteisten näytteenottomuodon että uudempien otantamuotojen rajoituksiin.

Lopuksi meidän on harkittava tarkasti kysymystä, ketä haastatella - emmekä saa lakata ajattelemasta sitä vain siksi, että olemme löytäneet sen, mitä pidämme hyväksyttävänä ratkaisuna nykyään. Se, mikä on totta tänään, ei ehkä ole totta huomenna, ja on aina tärkeää olla valppaana otantamenetelmien arvioinnissa. Vuoden 1936 Literary Digest -katkon opetukset ovat havainnollistavia tässä. Siinä tapauksessa sähköpostin palautusmenetelmä, joka oli tarkasti ennustanut jokaisen presidentinvaalin vuosina 1920–1932, epäonnistui yhtäkkiä ja näyttävästi (katso lisätietoja Squire 1988). On epäselvää, joudummeko samaan tilanteeseen tänään. Esimerkiksi Yhdistyneen kuningaskunnan vuoden 2015 vaaleihin johtaneet äänestykset ennustivat kuolleen lämpöä konservatiivipuolueen ja työväenpuolueen välillä. Lopulta konservatiivit kuitenkin ohjasivat työväen yli kuusi prosenttiyksikköä. Britannian vaalitutkimus, joka tehtiin heti vaalien jälkeen ja käytti satunnaista otosta, arvioi äänestystuloksen oikein, minkä vuoksi jotkut epäilivät, että epäonnistunut ennuste johtui virheistä, jotka johtuivat useimpien vaalikyselyiden käyttämistä satunnaisista aihealueista (Clark 2015). Samankaltaiset kokemukset muissa laajamittaisissa ja erittäin tärkeissä vaaleissa johtavat lisäkysymyksiin tiettyjen äänestysmenetelmien hyödyllisyydestä.


Kyselyn muotoilu

Tehokkaiden kohteiden kirjoittaminen on vain yksi osa kyselyn rakentamista. Ensinnäkin jokaisessa kyselyssä tulisi olla kirjallinen tai suullinen johdanto, joka palvelee kahta perustoimintoa (Peterson, 2000) [10]. Yksi on kannustaa vastaajia osallistumaan kyselyyn. Monissa tutkimustyypeissä tällaista rohkaisua ei tarvita, koska osallistujat eivät tiedä olevansa tutkimuksessa (kuten naturalistisessa havainnossa) tai koska he ovat osa aihepiiriä ja ovat jo osoittaneet halukkuutensa osallistua rekisteröitymällä ja näyttämällä opiskelemaan. Yleensä kyselytutkimus yllättää vastaajat, kun he vastaavat puhelimeensa, menevät postilaatikkoonsa tai tarkistavat sähköpostinsa-ja tutkijan on perusteltava, miksi heidän pitäisi suostua osallistumaan. Näin ollen johdannossa tulisi lyhyesti selittää tutkimuksen tarkoitus ja sen merkitys, antaa tietoa kyselyn sponsorista (yliopistopohjaiset kyselyt tuottavat yleensä korkeampia vastausprosentteja), tunnustaa vastaajan osallistumisen tärkeys ja kuvata mahdolliset osallistumisen kannustimet .

Johdannon toinen tehtävä on saada tietoinen suostumus. Muista, että tähän kuuluu kuvata vastaajille kaikki, mikä saattaa vaikuttaa heidän päätökseen osallistua. Tämä sisältää kyselyn kattamat aiheet, sen todennäköisesti kuluvan ajan, vastaajan mahdollisuuden vetäytyä milloin tahansa, luottamuksellisuusongelmat jne. Kirjallisia suostumuslomakkeita ei aina käytetä kyselytutkimuksessa (kun tutkimuksella on minimaalinen riski ja IRB hyväksyy usein kyselyvälineen valmistumisen todisteeksi osallistumisesta), joten on tärkeää, että tämä osa johdannosta on hyvä joka on dokumentoitu ja esitetty selkeästi ja kokonaisuudessaan jokaiselle vastaajalle.

Johdannon jälkeen on esitettävä olennaiset kyselylomakkeet. Mutta ensin on tärkeää esittää selkeät ohjeet kyselylomakkeen täyttämiseen, mukaan lukien esimerkkejä epätavallisten vastausasteikkojen käytöstä. Muista, että johdanto on kohta, jossa vastaajat ovat yleensä eniten kiinnostuneita ja vähiten väsyneitä, joten on hyvä käytäntö aloittaa tutkimuksen kannalta tärkeimmistä kohteista ja siirtyä vähemmän tärkeisiin kohteisiin. Kohteet tulee myös ryhmitellä aiheen tai tyypin mukaan. Esimerkiksi kohteet, jotka käyttävät samaa luokitusasteikkoa (esim. 5-pisteinen sopimusasteikko), olisi ryhmiteltävä yhteen, jos mahdollista, jotta asiat olisivat nopeampia ja helpompia vastaajille. Väestötiedot esitetään usein viimeisenä, koska ne ovat vähiten kiinnostavia osallistujille, mutta myös helppo vastata, jos vastaajat ovat väsyneet tai kyllästyneet. Tietenkin minkä tahansa kyselyn pitäisi päättyä ilmaisemalla kiitollisuutta vastaajalle.

  1. Sudman, S., Bradburn, N. M., & amp; Schwarz, N. (1996). Vastausten pohtiminen: Kognitiivisten prosessien soveltaminen kyselyn menetelmiin. San Francisco, CA: Jossey-Bass. & crarr
  2. Chang, L., & amp; Krosnick, J.A. (2003). Säännöllisen käyttäytymisen taajuuden mittaaminen: "Tyypillisen viikon" vertaaminen "viimeiseen viikkoon". Sosiologinen metodologia, 33, 55-80. & crarr
  3. Schwarz, N., & amp Strack, F. (1990). Kontekstivaikutukset asennetutkimuksissa: Kognitiivisen teorian soveltaminen sosiaaliseen tutkimukseen. Teoksissa W.Stroebe & amp.Hewstone (toim.), Sosiaalipsykologian eurooppalainen katsaus (Vuosikerta 2, s. 31–50). Chichester, Iso -Britannia: Wiley. & crarr
  4. Strack, F., Martin, L. L., & amp; Schwarz, N. (1988). Aloitus ja viestintä: Tietojen yhteiskunnalliset tekijät, jotka käyttävät tietoa elämän tyytyväisyyden arviointiin. European Journal of Social Psychology, 18, 429–442. & crarr
  5. Schwarz, N. (1999). Itseraportit: Kuinka kysymykset muokkaavat vastauksia. Amerikkalainen psykologi, 54, 93–105. & crarr
  6. Miller, J.M. & amp; Krosnick, J.A. (1998). Ehdokkaiden nimijärjestyksen vaikutus vaalituloksiin. Julkinen mielipide neljännesvuosittain, 62(3), 291-330. & crarr
  7. Krosnick, J.A. & amp; Berent, M.K. (1993). Puolueiden tunnistamisen ja toimintatapojen vertailut: Kyselyn kysymysmuodon vaikutus. American Journal of Political Science, 27(3), 941-964. & crarr
  8. Likert, R. (1932). Tekniikka asenteiden mittaamiseen. Psykologian arkisto, 140, 1–55. & crarr
  9. Peterson, R.A. (2000). Tehokkaiden kyselylomakkeiden luominen. Thousand Oaks, CA: Salvia. & crarr
  10. Peterson, R.A. (2000). Tehokkaiden kyselylomakkeiden luominen. Thousand Oaks, CA: Salvia. & crarr

Tahattomat vaikutukset vastaajien vastauksiin, koska ne eivät liity kohteen sisältöön vaan kontekstiin, jossa kohde esiintyy.

Kun kohteiden esitysjärjestys vaikuttaa ihmisten vastauksiin.

Kysy vain kysymys ja anna osallistujien vastata haluamallasi tavalla.

Kyselylomakkeet, jotka esittävät kysymyksen ja tarjoavat osallistujille rajoitetun valikoiman vastausvaihtoehtoja.

Järjestetty vastausjoukko, josta osallistujien on valittava.

Lyhenne, joka tarkoittaa "lyhyt", "relevantti", "yksiselitteinen", "erityinen" ja "objektiivinen", jota käytetään luomaan tehokkaita lyhyitä ja ytimekkäitä kyselylomakkeita.


Arvon kompromissien mittaaminen: ongelmia ja joitain ratkaisuja

Arvojen kompromissien mittaus on keskeinen sovelletussa päätösanalyysissä. Se oli myös Jane Beattien suuri huolenaihe opinnäytetyöstään lähtien työhönsä Graham Loomesin ja muiden kanssa, jotka on kuvattu viimeisessä luvussa. Osana väitöskirjaansa Jane tutki kahden määritteen ärsykkeiden kokonaisvaltaisten arviointien käyttämistä keinona mitata näiden kahden ominaisuuden välistä kompromissia (Beattie & amp; Baron, 1991).

Eräs mahdollinen vaikeuden vaikutus on tehdä kompromisseja koskevista tuomioista epävakaampia ja vaikuttaa enemmän vieraisiin tekijöihin. Eräänlainen kompromissiratkaisu on tehdä ärsykkeiden kokonaisvaltaisia ​​toivottavuusluokituksia ärsykkeiden joukossa, jotka vaihtelevat vähintään kahdessa ulottuvuudessa, esimerkiksi ostokustannukset ja matka -aika sen ostamiseksi. Kahden ulottuvuuden välisiä kompromisseja voidaan arvioida kysymällä, kuinka paljon yhdestä ulottuvuudesta on luovuttava, jotta voidaan korvata toisen ulottuvuuden muutos suhteessa näiden muutosten vaikutukseen luokitukseen. Tämän kompromissimittauksen tulisi heijastaa näiden muutosten vaikutusta tavoitteisiin, jotka johtavat tuomioihin, esim. Halukkuuteen uhrata aikaa säästääkseen rahaa. Kummankaan ulottuvuuden arvoalue ei saisi vaikuttaa siihen.

Havaitsimme yleensä, että vaihteluväli ei itse asiassa vaikuta kompromisseihin edellyttäen, että vaihteluväli ei välittänyt mitään hyödyllistä tietoa. Jos tämä tulos on yleensä totta, kokonaisvaltaiset tuomiot olisivat hyvä tapa mitata kompromisseja käytännön tarkoituksiin. Mellers ja Cooke (1994) löysivät kuitenkin erilaisia ​​vaikutuksia useissa vastaavissa tehtävissä.

Tämä tutkimus havaitsee epäjohdonmukaisen herkkyysmallin itseään kohtaan. Se on kuitenkin myös havainnut arvojen suuruusvaikutuksia, jotka voivat olla riippumattomia vaihtelualueesta koeryhmässä. Esimerkiksi rahan määrä, joka on säästettävä ylimääräisen tunnin käyttämisen perustelemiseksi, on suurempi, kun ostohinta on korkeampi, ikään kuin rahan hyödyllisyys arvioitiin osuutena hinnasta eikä absoluuttisena summana. Jotkut etäisyysvaikutukset voivat johtua suuruusvaikutuksista, mutta emme silti ymmärrä olosuhteita, jotka tuottavat aluevaikutuksia, kun suuruus pidetään vakiona.

Johdanto

Arvojen kompromissien mittaus on keskeinen sovelletussa päätösanalyysissä. Kuinka paljon rahaa elämä on? Terveyden vuosi? Tunnin helpotus kivusta? Miten meidän pitäisi valita hoidon oireet valitessaan syövän hoitoa paranemisen todennäköisyyttä vastaan? Miten meidän pitäisi ostaa auto ostaessamme auton turvallisuus kuljettajalle sen vaikutuksia ilmansaasteisiin? Jos voisimme vastata näihin kysymyksiin keskimäärin, voisimme suunnitella käytännöt, jotka on suunniteltu maksimoimaan hyödyllisyys. Esimerkiksi terveydenhuollon tarjoaja voisi tarjota kaikki hengenpelastavat hoidot siihen pisteeseen asti, jolloin keskimääräiset kustannukset elinvuotta kohden ovat enemmän kuin sen asiakkaat tai kansalaiset keskimäärin ajattelevat maksettavan. Samaa voidaan sanoa muista julkisista menoista moottoritien turvallisuudesta erämaiden suojeluun.

Tämän lähestymistavan ongelma on se, että vastaukset ovat usein sisäisesti epäjohdonmukaisia ​​(Baron, 1997a). Osa epäjohdonmukaisuuksista on ominaista käytetyille menetelmille. Esimerkiksi hypoteettisten uhkapelien käyttöä näyttää vääristävän varmuusvaikutus ja yleisemmin se, että todennäköisyyksiä, jotka ovat suurempia kuin nolla ja pienempi kuin yksi, näytetään kohdeltavan samankaltaisemmilta kuin niiden pitäisi olla.

Muut epäjohdonmukaisuuden lähteet ovat yleisempiä. Ensisijaisesti ihmiset eivät ole herkkiä määrälle, kun he vertaavat kahta ominaisuutta. Ihmisten on yllättävän helppo sanoa, että terveys on tärkeämpää kuin raha, kiinnittämättä paljon huomiota kyseiseen terveyteen tai rahamäärään. Esimerkiksi Jones-Lee, Loomes ja Philips (1995) pyysivät vastaajia arvioimaan hypoteettisia auton turvalaitteita, jotka vähentäisivät liikennevammojen riskiä. Vastaajat ilmoittivat olevansa valmiita maksamaan (WTP) laitteista. WTP -tuomiot olivat keskimäärin vain 20% korkeammat, kun riski pieneni 12: lla 100 000: sta kuin 4: llä 100 000: sta. Tällaiset tulokset viittaavat siihen, että rahan ja tavaran välinen korvausaste, dollaria yksikköä kohden, riippuu vahvasti tavaran määrästä. Jos 12: n riskinvähennys on 120 dollarin arvoinen ja 4: n riskinvähennys 100 dollarin arvoinen, dollari riskinvähennysyksikköä kohti on 10 ja 25 vastaavasti. Jos ekstrapoloimme alaspäin lineaarisesti, 0: n riskinvähennys olisi 90 dollarin arvoinen. Tai voimme ajatella, että asteikko on logaritminen, joten 1/3 riskinvähennyksestä olisi 5/6 hinnan arvoinen. Joten riskinvähennys 4 · 1 /3· 1 /3, tai .44, olisi 100 dollarin arvoinen ja#183 5 /6 · 5 /6 tai 69,44 dollaria tai noin 156 dollaria riskinvähennysyksikköä kohden. Dollari yksikköä kohti voi nousta ilman rajoituksia. Emme voi kertoa virheen koosta luottamusvälillä - edes logaritmisella asteikolla - koska luottamusväli on mahdollisesti rajaton. Tämä vaikeuttaa tulosten yleistämistä eri rahasummille tai riskeille, mikä on lähes aina tarpeen. Vaikka tällaista yleistämistä ei tarvita, tällainen äärimmäinen epäherkkyys pienillä alueilla herättää kysymyksiä minkä tahansa yksittäisen arvion pätevyydestä.

Ongelma ei rajoitu WTP: hen. Näin tapahtuu, kun vastaajia pyydetään määrittämään suhteelliset painot suoraan ei-rahallisille määritteille. Tyypillisesti attribuutit annetaan selkeillä alueilla, kuten '' ero $ 10 ja $ 20 maksamisen välillä '' ja '' ero riskin välillä 1/10 000 ja riskin välillä 2/10 000. '' tyypillisesti aliherkkä määritteiden alueelle. Jos riskin katsotaan olevan kaksi kertaa niin tärkeä kuin kustannukset, tämä arviointi ei vaikuta suhteellisesti, kun riskinvähennys kaksinkertaistetaan (Weber & amp; Borcherding, 1993). Keeney (1992, s. 147) kutsuu tällaista aliherkkyyttä vaihteluvälille `` yleisimmäksi kriittiseksi virheeksi ''.

Kolmas arviointityyppi kärsii samasta ongelmasta, kahden välin suhteellisen hyödyllisyyden arviointi. Terveystilanteissa vastaajia pyydetään usein arvioimaan jokin sairaus, kuten yhden silmän sokeus, asteikolla, joka on ankkuroitu normaaliin terveyteen ja kuolemaan. Epäsuorasti heitä pyydetään vertaamaan kahta aikaväliä: normaali-sokea silmässä ja normaali-kuolema. Mitä tapahtuu, kun muutamme standardia, toista aikaväliä? Normaalisti tuomion pitäisi muuttua suhteessa. Esimerkiksi pitämällä normaali jokaisen ulottuvuuden toisessa päässä, sokean silmässä hyödyllisyyden suhteessa kuolemaan pitäisi olla kahden muun mittasuhteen tulos: sokean silmässä hyödyllisyys suhteessa sokeuteen (molemmissa silmät) ja sokeuden hyöty suhteessa kuolemaan. Itse asiassa ihmiset eivät sopeudu riittävästi standardin muutoksiin (Ubel et ai., 1996), aivan kuten he eivät sopeudu riittävästi muutoksiin muiden ulottuvuuksien laajuudessa, jotka liittyvät muihin kompromissituloksiin. Kutsun tätä ilmiötä `` suhde epäjohdonmukaisuudeksi '', koska se perustuu suhteiden tuloon (Baron et al., 1999). Näen myös nämä erilaiset herkkyyden muodot saman ongelman ilmentyminä. Periaatteessa kaikki tunnetut herkkyyden ilmentymät voitaisiin ymmärtää taipumuksina antaa sama vastaus kysymyksestä riippumatta. On avoin kysymys, voidaanko epäjohdonmukaisuuden eri muodot selittää samalla tavalla vai ei.

Aliarvostusta kantamaan voidaan vähentää. Fischer (1995) havaitsi täydellisen aliherkkyyden vaihteluvälille, kun vastaajia pyydettiin yksinkertaisesti määrittämään painot alueille (esim. Ero 25 000 ja 35 000 dollarin aloituspalkan ja 5–25 lomapäivän - tai 10–20 lomapäivän - välillä työ). Kun lomapäivien määrä kaksinkertaistui, koko päivän (10 vs. 20) arvioitu merkitys suhteessa palkka -alueeseen (10 000 dollaria) ei kasvanut. Näin ollen vastaajat osoittivat epäjohdonmukaisia ​​korvausasteita tarkastelualueesta riippuen. Vastaajat olivat herkempiä vaihteluvälille, ja niiden painot lähestyivät vaadittua kaksinkertaistumista ja kaksinkertaistivat alueen, kun he käyttivät joko suoria kompromisseja tai kääntöpainoja. Suorassa kompromississa vastaaja muutti yhden arvon tärkeämmästä ulottuvuudesta siten, että nämä kaksi ulottuvuutta olivat yhtä tärkeitä, esimerkiksi alentamalla palkkaulottuvuuden ylintä palkkaa. (Painot on pääteltävä joko mittaamalla tai olettaen hyötyfunktio kullekin ulottuvuudelle.) Swing -painomenetelmässä vastaajat arvioivat vähemmän tärkeiden ja tärkeämpien alueiden suhdetta, esim. `` 5 ja 25 lomapäivän välinen ero on 1/5 25 000 ja 35 000 dollarin välisestä erosta. ''

Suorassa kompromissimenetelmässä alue annetaan vain yhdelle ulottuvuudelle. Tehtävä on siis analoginen vapaavalintaisen CV -tuomion kanssa, joten voimme silti odottaa - ja Fischer löysi edelleen - jonkin verran epäherkkyyttä. Baron ja Greene (1996) havaitsivat, että tätä epäherkkyyttä voitaisiin vähentää entisestään antamatta mitään erityisiä alueita jompikumpi ulottuvuus. Vastaajia pyydettiin esittämään kaksi aikaväliä, yksi yhdessä ulottuvuudessa ja toinen, jotka olivat yhtä suuria hyödyllisyydeltään. Esimerkiksi sen sijaan, että kysyisit `` Kuinka paljon olisit valmis maksamaan korotetusta verotuksesta vuosittain estääksesi 10%: n vähennyksen maa-alueiden hankinnassa kansallispuistoille? '', Kahden välin edellytys pyysi tutkittavia antamaan verot ja prosentuaalinen alennus, jota he vastaavat. Tietenkin jokaisen jakson toinen pää oli nolla.

Kokonaisarvosanat

Toinen tapa mitata kompromisseja on pyytää ärsykkeiden luokituksia, jotka vaihtelevat kahdessa tai useammassa ulottuvuudessa. Ärsykkeet voivat olla esimerkiksi politiikkoja, jotka eroavat toisistaan ​​kustannuksissa ja pienentyneessä riskissä. Jos vastaaja tuottaa tarpeeksi näitä tuomioita, voisimme sovittaa hänen vastauksiinsa yksinkertaisia ​​malleja ja päätellä, kuinka paljon yhden ulottuvuuden muutosta tarvitaan toisen ulottuvuuden muutoksen korvaamiseksi, jotta molemmat muutokset yhdessä antaisivat saman arvosanan. Luokitusvasteen ei tarvitse olla lineaarinen funktio yleisestä hyödyllisyydestä (mutta voisimme olettaa, että se oli ensimmäistä arviointia varten). Suuri valikoima menetelmiä käyttää tätä yleistä lähestymistapaa. Kaksi yleisintä termiä ovat toiminnallinen mittaus (esim. Anderson & amp; Zalaski, 1988) ja yhteinen analyysi (Green & amp Wind, 1973 Green & amp; Srinivasan, 1990 Louviere, 1988).

Tällaisessa menetelmässä vastaajalle annetut numerot kussakin ulottuvuudessa edustavat vastaajan arvostamia ominaisuuksia, kuten minuutteja tai dollareita. Näiden ominaisuuksien arvo ei oletuksena ole riippuvainen muista käytettävissä olevista asioista. Näin ollen kummankin ulottuvuuden vaihteluväli ei saisi vaikuttaa kompromissiin tietyn yhden ulottuvuuden muutoksen ja toisen muutoksen välillä toisessa kokeellisessa istunnossa. Jos muutos 50 minuutista 100 minuuttiin kannattaa muuttaa 20 dollarista 40 dollariin, tämän pitäisi olla totta riippumatta siitä, onko dollarin vaihteluväli 20–40 dollaria vai 2–400 dollaria. Epävarmuuden tarve ajan ja rahan korvaamisessa johtuu itse hyödyllisyyden perusideasta, nimittäin siitä, että kyse on tavoitteiden saavuttamisesta (Baron, 1994). Se, missä määrin tavoitteet saavutetaan, riippuu siitä, mitä tapahtuu, ei siitä, mitä vaihtoehtoja harkittiin.

On kuitenkin huomattava kaksi poikkeusta. Ensinnäkin joskus harkitut vaihtoehdot vaikuttavat lopputulokseen niiden vaikutusten kautta tunteisiin. 80 dollarin voittaminen voi tuntua paremmalta, jos se on ensimmäinen palkinto, kuin jos 160 dollaria on ensimmäinen palkinto, koska pettymys ei ole voittanut ensimmäistä palkintoa. Toiseksi, joissakin tapauksissa merkitys kuvauksen tavoitteiden saavuttamisen kannalta riippuu alueesta. Esimerkiksi tutkimuksen raakapisteillä voi olla erilainen vaikutus tavoitteiden saavuttamiseen, koska pistealue vaihtelee, jos tutkimus arvioidaan käyrällä. Vaikka tämä ei pidä paikkaansa, vastaajat, jotka tietävät vähän määrällisestä muuttujasta, saattavat ajatella sitä tällä tavalla, koska he eivät voi arvioida numeroiden merkitystä (esim. 1996).

Beattie ja Baron (1991) käyttivät tällaista kokonaisvaltaista luokittelutehtävää, mutta eivät löytäneet suhteellisten vaihteluvälien vaikutuksia korvausasteisiin useilla ulottuvuuspareilla, mutta löysimme aluevaikutuksia joillakin ulottuvuuksilla, erityisesti niillä, joiden numeerinen esitys ei ollut selvästi yhteydessä perustavoitteisiin, esimerkiksi tentin numeerisiin arvosanoihin. (Tentiarvojen merkitys riippuu vaihtelusta.) Tämä antoi meille toivoa, että kokonaisarvioinnit voisivat antaa johdonmukaisia ​​ja merkityksellisiä arvioita kompromisseista. Lynch et ai. (1991) eivät myöskään löytäneet enimmäkseen mitään vaihteluvälivaikutuksia hypoteettisiin autonostoihin, paitsi yhdessä tutkimuksessa aloittelevien kuluttajien kanssa. (He käyttivät kuitenkin korrelaatioita sijaan korvausnopeuksia, joten on vaikea sanoa, kuinka paljon niiden tulokset johtuivat varianssin muutoksista.) Mellers ja Cooke (1994) löysivät kuitenkin erilaisia ​​vaikutuksia tehtävissä, joissa lukujen suhde perustavoitteisiin nähden, esim. etäisyys asuntojen kampukselle.

Tässä raportoimat kokeet saavat minut pessimistisemmäksi kokonaisvaltaisista luokituksista. Vaikka en voi täysin selittää ristiriitaisia ​​tuloksia, olen pystynyt osoittamaan, että kokonaisvaltaisiin luokituksiin liittyy yleensä toinen vaikutus, joka voi olla yhtä vakava, erityisesti suuruusvaikutus. Ihmiset arvioivat muutoksen tai eron hyödyllisyyden suhteessa potentiaalin kokonaismäärään, vaikka muutos yksin liittyy läheisemmin tavoitteeseen (Baron, 1997a). Tuloksena on, että arvioinnit riippuvat kunkin attribuutin asteikon suurimmasta suuruudesta. Klassinen esimerkki on Tverskyn ja Kahnemanin takkilaskijaongelma (1981, jossa Darke & amp; Freedman, 1993) toisti tietyissä olosuhteissa.

Suurin osa kysytyistä oli valmis tekemään matkan säästääkseen 5 dollaria. Hyvin harvat koehenkilöt olivat halukkaita tekemään matkan säästääkseen 5 dollaria takista, muuten muuten samanlaisessa ongelmassa. Molemmissa tapauksissa `` todellinen '' kysymys on, olisitko valmis ajamaan 20 minuuttia 5 dollarilla. Ihmiset arvioivat 5 dollarin säästämisen hyödyllisyyden suhteessa kokonaissummaan eikä sen vaikutusten perusteella muihin tavoitteisiin, toisin sanoen vaihtoehtoisiin kustannuksiin. Baron (1997b) havaitsi samanlaisen vaikutuksen: koehenkilöt olivat vähemmän halukkaita maksamaan valtion sairausvakuutuksesta sairauksille, kun parantumattomien ihmisten määrä oli suurempi pitäen ennallaan parannettavat. Kun monia ihmisiä ei parannettu, muutamien parantaminen vaikutti `` pudotukseen ämpäriin '' ja oli siten aliarvostettu.

Yleensä suuruus- ja kantavaikutukset sekoittuvat. Suuruus määritellään maksimin ja nollan välisenä erona, ja alue määritellään maksimin ja minimin välisenä erotuksena. Yleensä kokeilijat, jotka vaihtavat vaihteluväliä, manipuloivat myös maksimin. Itse asiassa sekä Beattiella ja Baronilla (1991) että Mellersillä ja Cookella (1993) oli kussakin määritteessä maksimiarvot suurempia aina, kun alue oli korkeampi. Ilmeisesti suuruusvaikutuksia ei aina tapahdu. Tosin niiden esiintyminen tekee toimenpiteestä epäluotettavan. Tarkoitus on, että ne tapahtuisivat, jos suuruusluokka muuttuisi tarpeeksi, joten aiheiden tekemä kompromissi on ominainen niille annettujen mittojen suuruuksille.

Baron (1997b) ehdottaa, että suuruusvaikutus on osa perustavaa laatua olevaa sekaannusta samanlaisten (ja usein korreloivien) määrällisten mittausten välillä. Aivan kuten pienet lapset vastaavat numeroita koskeviin kysymyksiin ikään kuin ne liittyisivät pituuteen (korreloiva ominaisuus) ja päinvastoin, niin aikuiset vastaavat eroja koskeviin kysymyksiin ikään kuin suhteista ja päinvastoin. Erot ja suhteet korreloivat. Näin ollen keskusteltaessa lääkkeiden vaikutuksista riskiin ihmiset puhuvat suhteellisesta riskistä (esim. Rintasyöpätapausten suhde lääkkeeseen ja tapauksiin, joissa sitä ei ole) eikä riskin muutoksesta (syövän todennäköisyyden ero ja syövän todennäköisyyden ero ilman). Viimeksi mainittu on tärkeämpää päätöksenteossa.

Sekä puhtaan alueen vaikutukset että suuruusvaikutukset voivat johtua a: n käytöstä suhteellisuus heuristinen. Joku, joka käyttää tätä heuristiikkaa, arvioi yhden ominaisuuden muutoksen suhteena johonkin muuhun, vaikka se olisi arvioitava yksinään. Tämä on kohtuullinen heuristiikka, kun emme tiedä mitään attribuutin merkityksestä. Esimerkiksi kun arvioimme 30 pisteen ja 40 pisteen välisen eron välitestissä, tämän eron merkitys voi hyvinkin riippua siitä, onko pistealue 20-50 vai 0-60.

Yleiskatsaus

Tämän luvun loppuosassa kuvailen kahta kokeilua. Ensimmäinen sarja osoittaa suuruusvaikutusten olemassaolon kokonaisvaltaisissa luokituksissa ja kuvaa joitain niiden esiintymisen rajoja. Tulokset vahingoittavat ajatusta käyttää kokonaisvaltaisia ​​luokituksia kompromissien mittaamiseen.

Kahdessa viimeisessä kokeessa tutkin erilaista lähestymistapaa ja jatkan siitä, mihin Loomes jäi lukemasta. Ehkä voimme mitata arvokkaita kompromisseja työskentelemällä vastaajien kanssa, kohdata heidät tuomioidensa epäjohdonmukaisuuksiin ja pyytää heitä ratkaisemaan nämä epäjohdonmukaisuudet. Päätösanalyytikot väittävät, että johdonmukaisuustarkastukset eivät yleensä loukkaa vastaajan parasta harkintaa, esimerkiksi: ``. jos johdonmukaisuustarkastuksissa ilmenee ristiriitoja päätöksentekijän ilmoittamien aiempien mieltymysten kanssa, nämä erot on kiinnitettävä hänen tietoonsa ja osa arviointimenettelystä on toistettava, jotta saadaan yhdenmukaiset mieltymykset. . Tietenkin, jos vastaajalla on vahvat, terävät, muuttamattomat näkemykset kaikista kysymyksistä ja jos ne ovat epäjohdonmukaisia, olisimme sekaisin, eikö niin? Käytännössä vastaaja kuitenkin tuntee yleensä olevansa epätarkempi joistakin vastauksistaan ​​kuin toiset, ja juuri tämä epätarkkuuden aste tekee yleensä eron. Sillä silloin on yleensä mahdollista luoda lopullinen johdonmukainen vastausjoukko, joka ei ole väkivaltaisesti ristiriidassa voimakkaiden tunteiden kanssa '' (Keeney & amp; Raiffa, 1993, s. 271). Tällaiset tarkastukset voivat jopa parantaa numeeristen arvioiden pätevyyttä (esim. Keeney & amp; Raiffa, 1993, s. 200).

Baron et ai. (1999) löysi todisteita näiden väitteiden tueksi tutkimuksissa, jotka koskivat terveysalan palveluiden saamista. Yllä kuvatut suhdeherkkyyden yhdenmukaisuustarkastukset eivät johtaneet aiheisiin vakavia vastalauseita. Lisäksi erilaiset hyödyllisyystoimenpiteet sopivat todennäköisemmin, kun kutakin toimenpidettä aiheen mukaan muutettiin, jotta se olisi johdonmukainen.

Koe 1

Koe 1 perustuu takkilaskimen ongelmaan. Koehenkilöt tekivät kolme tehtävää:
Arvosana: Koehenkilöt arvioivat houkuttelevuuden vuoksi ostot, jotka eroavat hinnasta ja ajasta.
WTP: Koehenkilöt ilmaisivat halukkuutensa maksaa (WTP) rahaa säästääkseen aikaa tai rahaa.
Erilaiset arvostelut: Koehenkilöt vertasivat aikaväliä (esim. `` 30 minuutin ja 1 tunnin välinen ero '') ja hintaväliä (esim. `` 90 dollarin ja 100 dollarin välinen ero ''). He ilmoittivat, mikä oli heille tärkeämpää, ja välien suhteelliset koot suhteessa asiaan.

Suuruus ja kantama vaihtelivat hieman itsenäisesti. Suuruusluokkaa manipuloitiin kertomalla hinta 4: llä. Arviointitehtävässä vaihteltiin vaihteluvälillä vaihtamalla kaksi ensimmäistä kohtaa kussakin 8 hengen ryhmässä.

Menetelmä

53 tutkittavaa - 38% miehiä, 92% opiskelijoita, ikä 17-52 (mediaani 19) - täytti kyselyn Internetissä. Aiheita pyydettiin julkaisemalla uutisryhmiä ja linkkejä eri verkkosivuilta. Heille maksettiin 4 dollaria, ja heidän täytyi antaa osoite ja sosiaaliturvatunnus voidakseen maksaa.

Kyselyssä oli kaksi tilausta. Järjestys ei vaikuttanut tulokseen. Kyselylomakkeessa oli neljä osaa, Ratings, WTP, Difference Judgments ja Ratings.

Arviointitehtävä alkoi: `` Kuvittele, että ostat kannettavan CD-soittimen ja olet päätynyt brändiin, joka on listattu 120 dollarilla. Sitä on saatavana useista kaupoista, jotka eroavat matka -ajalta asuinpaikastasi (edestakainen matka), myyntihinnasta ja takuuehdoista. Arvioi seuraavat houkuttelevuuden vaihtoehdot asteikolla 1 - 9, jossa 1 tarkoittaa, että et todennäköisesti valitse tätä vaihtoehtoa ja 9 tarkoittaa, että valitset sen erittäin todennäköisesti. Yritä käyttää koko asteikkoa. Kaksi ensimmäistä tuotetta ovat pahimpia ja parhaita. '' Tuotteet erosivat hinnasta, matka -ajasta ja takuusta. Takuua ei analysoitu. Sitä käytettiin yksinkertaisesti muunnelman luomiseen, jotta muutoin samanlaiset kohteet voitaisiin esittää kahtena kappaleena. Se tasapainotettiin kaikkien muiden muuttujien kanssa. Tyypillinen luettelo arvioitavista kohteista oli:

Huomaa, että tässä luettelossa kummankin 8 hengen ryhmän kahden ensimmäisen kohteen hintaluokka on 40 dollaria ja aikaväli 1 tunti. Vastakkaisessa tilassa aika -alue oli 2 tuntia (0–2 tuntia) ja hintaluokka 20 dollaria (90–110 dollaria). Suurikokoisissa olosuhteissa hinta yksinkertaisesti kerrottiin kolmella, joten valikoima kerrottiin myös kolmella. Kaksi tavaraa, CD-soitin ja televisio, ilmestyivät kahdessa järjestyksessä eri aiheille. Yhdessä järjestyksessä ehdot olivat:
CD, edullinen hinta, korkea hintaluokka (alhainen aikaväli)
TV, korkea hinta, korkea hintaluokka
CD, edullinen hinta, korkea aikaväli (matala aika -alue)
TV, korkea hinta, pitkä aikaväli.
Toisessa järjestyksessä olosuhteet käännettiin.

Kahden ensimmäisen ja toisen luokituksen välissä olivat WTP- ja ero -ehdot (aina tässä järjestyksessä). Tyypillinen tuote WTP -tilassa lukee: `` Aiot ostaa 110 dollarin CD -soittimen 1 tunnin matkan päässä olevasta kaupasta. Mikä on suurin aika, jonka olisit valmis käyttämään matkoille ostaaksesi sen sen sijaan 100 dollarilla? '' Tai '' Mikä on suurin summa, jonka olisit valmis maksamaan yhdestä, joka on 30 minuuttia. Koehenkilö neuvottiin vastaamaan kokonaishinnan tai ajan perusteella. Ensimmäiselle tilaukselle WTP -ehdot järjestettiin taulukon 1 mukaisesti, ja ne käännettiin toiselle tilaukselle.

Pöytä 1.
Tavaroiden käyttö WTP -olosuhteissa kokeessa 1. Oikeassa reunassa olevassa sarakkeessa ovat päättelydollarin geometriset keskiarvot.

Ero -tuomiossa tyypillinen kohde oli:

Kumpi ero on sinulle tärkeämpi?
1. Ero 90 ja 100 dollarin välillä CD -soittimessa.
2. Ero 30 minuutin ja 1,5 tunnin matka -ajan välillä.

Kuinka monta prosenttia suuremmasta erosta on pienempi ero sen suhteen, kuinka paljon sillä on väliä?

(Jälkeenpäin ajateltuna tämän kohdan sanamuotoa on vaikea ymmärtää. Tietoanalyysissä kuitenkin poistettiin kohteita, jotka osoittivat väärinkäsityksiä vastaamalla päinvastaisella tavalla.)

Ensimmäisen tilauksen kohdat on esitetty taulukossa 2 (käänteinen toiselle tilaukselle). Huomaa, että vaihteluväli oli sekä hinta että aika: kun hintaluokka on korkeampi, aikaväli on pienempi. Tämä tekee kantaman käsittelystä vahvempaa.

Taulukko 2.
Koe 1 -erotehtävässä käytetyt kohteet. Taulukossa esitetään vastausten hyvä, vertailuvälit ja geometrinen keskiarvo.

Tulokset

Suunnittelu mahdollisti johtopäätöksen dollarin ja tunnin välisestä kompromissista kaikissa olosuhteissa. Arvioiden osalta laskin ortogonaalisen kontrastin hinnan ja ajan vaikutuksille luokituksiin ja otin suhteen. Laskin geometrisen keskiarvon kohteiden välillä ja tein tilastolliset testit logaritmeille. (On mielivaltaista käyttää suhdetta vai sen vastavuoroista. Lokin käyttö tarkoittaa, että tämä valinta vaikuttaa vain merkkiin, ei etäisyyteen nollasta.)

Luokitusten osalta päätellystä ajan rahallisesta arvosta vaikutti suuruus (sekoitettiin alueeseen), mutta se ei vaikuttanut pelkästään alueeseen. (Geometrinen keskiarvo) -arvot olivat (kohteille, joilla oli riittävästi tietoa molemmissa olosuhteissa): 20,32 dollaria suurille rahasummille ja 89,33 dollaria pienille määrille (t47 = 13,71, p = 0,0000) ja 43,60 dollaria, kun raha -alue oli pieni (ja aikaväli suuri) verrattuna 46,13 dollariin, kun raha -alue oli suuri (ja aika pieni).

WTP: n osalta geometriset keskiarvot päätellyistä dollareista tunnissa esitetään taulukossa 1. T-testit asiaankuuluvien ehtojen keskiarvoista (esim. Kaikki korkeat dollarit vs. kaikki alhaiset dollarit) osoittivat, että aika oli arvokkaampi dollarin suuruusluokassa oli korkeampi (t52 = 11,4, p = 0,0000) ja kun kohde vastasi rahalla eikä ajalla (t44 = 8,14, p = 0,0000). Koehenkilöt maksoivat myös enemmän ajasta, kun aika -alue oli pieni tai kun raha -alue oli suuri, pitäen suuruusluokkaa vakiona (t51 = 4,34, p = .0001). Yhteenvetona voidaan todeta, että WTP -mittari osoitti sekä suuruus- että etäisyysvaikutuksia, kun taas luokitusmitta osoitti vain suuruusvaikutusta.

Eroarvioinnit osoittivat myös molempien alueiden vaikutuksia (t47 = 3,85, p = .0004) ja suuruus (t47 = 5,69, p = 0,0000), kuten on esitetty taulukossa 2. Suuruus sekoitettiin alueeseen. Joten näitä vaikutuksia voidaan pitää toisintona havainnosta, jonka mukaan vastaavat tuomiot eivät ole herkkiä vaihteluvälille (esim. Fischer, 1995, katso Baron, 1997a, keskusteluun).

Yhteenvetona tuloksista, kaikki kolme mittausta - kokonaisarvioinnit, maksuvalmius ja eroarviointi - vaikuttivat suuruuteen (sekoitettiin vaihteluvälin kanssa), mutta pelkkä vaihteluväli vaikutti vain eroarvioihin ja WTP: hen. Yksi selitys näille tuloksille on, että WTP- ja erotehtävät esittivät vertailtavan alueen kaksi päätä, mikä rohkaisi tutkittavia pitämään näitä kahta päätä asiaankuuluvina vertailukohtina. Kokonaisarvosanat sitä vastoin ovat saattaneet sallia tutkittavien hyväksyä implisiittisen nollan kunkin alueen alarajaksi.

Olipa selitys mikä tahansa, tosiasia on edelleen se, että suuruusvaikutukset tekevät näistä tehtävistä epätyydyttäviä kompromissimittareina.

Koe 2

Koe 2 manipuloi vaihteluväliä ja suuruutta paikallisesti neljän hypoteettisen oston ryhmän sisällä esittämällä kaksi kohdetta alueen määrittämiseksi ja sitten kaksi muuta testatakseen kahden ensimmäisen vaikutuksen. Alue manipuloitiin pitämällä jokaisen ulottuvuuden yläosa vakiona ja vaihtamalla alaosaa: yhdessä tilanteessa rahat vaihtelivat 120 dollarista 80 dollariin ja aika 120 minuutista 0 minuuttiin, ja toisessa tapauksessa raha vaihteli 120 dollarista 100 dollaria ja aika 120-60 minuuttia. Suuruusluokan manipulointi lisäsi hintaan vain 100 dollaria pitäen vaihteluvälin vakiona.

Menetelmä

Kahdeksankymmentä tutkittavaa - 25% miehiä, 51% opiskelijoita, 16-51 -vuotiaat (mediaani 23) - täytti kyselylomakkeen Internetissä 5 dollarilla. Kysely alkoi:

Ostokset: aikaa ja rahaa

Tässä on kyse siitä, miten ihmiset tekevät kompromisseja ajan ja rahan välillä ostaessaan kulutustavaroita. Kuvittele, että kaikki kohteet viittaavat johonkin ääni- tai videolaitteeseen, kuten CD-soittimeen tai televisioon. Olet päättänyt ostaa tietyn mallin kullakin näytöllä ilmoitetusta hintaluokasta. Kysymys on siitä, oletko valmis matkustamaan jonkin matkan säästääksesi rahaa hinnassa.

Puolet ajasta arvioit yhden ostoksen kerrallaan 9-asteikolla (1 = erittäin epätodennäköistä ostaa, 5 = välinpitämätön, 9 = erittäin todennäköisesti ostaa). Muina aikoina vertaat kahta ostosta, myös 9-asteikolla (1 = A on paljon parempi, 5 = sama, 9 = B on paljon parempi). Jotkut ostokset toistetaan useita kertoja. Tämä ei ole ärsyttää sinua, mutta varmista, että kiinnität huomiota niiden olemassaoloon. Kun näet nämä toistuvat ostokset, sinun ei tarvitse antaa samaa vastausta kuin aiemmin, mutta voit, jos haluat.

On 56 kysymysnäyttöä (2 tai 4 kysymystä ruudulla) ja sen jälkeen muutama sinua koskeva kysymys.

Jokaisella yksittäisen ostoksen arviointinäytöllä (lyhyesti arviointi) oli neljä ostosta ja jokaisella ostovertailunäytöllä kaksi. Ostokset kuvattiin hinnan ja ajan suhteen, esim. `` $ 100, 60 minuuttia ''. Taulukossa 3 esitetään sekä arviointi- että vertailuehdoissa käytetyt perusarvot:

Taulukko 3.
Perusehdot kokeelle 2. Jokainen rivi edustaa yhdellä näytöllä esitettyjä kohteita. Vertailutilanteessa koehenkilö vertasi A: ta ja B: tä ja sitten C: tä ja C: tä. Arviointitilassa koehenkilö arvioi A, B, C ja D. ) ja dollarin vaihteluväli (100-120). Tapauksissa 8-14 aikaväli on korkea (60-120) ja dollarin vaihteluväli korkea (80-120).

Jokaisessa vertailunäytössä esitettiin vertailu A: sta ja B: stä sekä C: stä ja D: stä. Jokainen arviointinäyttö esitti A, B, C ja D erikseen. Huomaa, että tämän perusrakenteen puitteissa ensimmäisten seitsemän ostoksen aikavyöhyke (0-120 min) on suuri ostoille A ja B ja alhainen hintaluokka (100-120 dollaria). Toiset seitsemän ostosta ovat päinvastaisia ​​(60–120 min. Vs. 80–120 dollaria). Kunkin näytön kaksi viimeistä ostosta ovat samat vastaaville tuotteille. Näin ollen suhteellisten ajanjaksojen ja hintojen vaikutukset määritetään tarkastelemalla ostosten C ja D vastauksia. Huomaa myös, että vaihteluvälien huiput ($ 120 ja 120 min.) Ovat vakiorakenteen kohteiden sisällä.

Tämä perusmalli toistettiin neljä kertaa 56 näytön valmistamiseksi. Toistot 1 ja 2 olivat vertailuja, 3 ja 4 arviointeja. (Ohjelmointivirheen vuoksi arviointitiedot katosivat 28 koehenkilöstä, jäljelle jäi 52.) Toistot 2 ja 4 laajensivat hintojen suuruutta ja vaihteluväliä lisäämällä 100 dollaria kuhunkin hintaan. Toistojen 2 vertailu 1: llä ja 4 3: lla testaa sitten suuruusvaikutusta.

56 näytön järjestys satunnaistettiin erikseen jokaiselle aiheelle.

Tulokset

Kompromissin mittana laskin suhteellisen etusijan vaihtoehtoon alhaisemmalla hinnalla (ja pidemmällä ajalla). Jos ihmiset arvioivat hintaa ja aikaa suhteessa alueisiinsa, tämä suhteellinen etusija olisi suurempi, kun hintaluokka on pieni ja aikaväli on korkea. Tämä tulos tapahtui arvioinneissa (t51 = 4,67, p = 0,0000), mutta ei vertailuissa (t = 0,94). Arviointikohteissa, kun hintaluokka oli pieni, koehenkilöt suosivat halpaa tuotetta keskimääräisellä luokituserolla 0,30, mutta kun alue oli korkea, he suosivat vähäaikaista tuotetta 0,34.

Yksinkertainen selitys tälle tulokselle on, että arviointitilassa koehenkilöt huolehtivat kaikista neljästä näytöstä, jotka esitetään jokaisessa näytössä. Kun jokin tuotteista sisältää erittäin alhaisen hinnan, se antaa sille korkean arvosanan, mutta silloin he kokevat velvollisuutensa antaa alempi luokitus tuotteelle, jolla ei ole niin alhaista hintaa. Yhteenvetona voidaan todeta, että arviointikohteiden osalta kaksi ensimmäistä kohtaa muodostivat erilaisia ​​vastauksia. Vertailukohteissa sitä vastoin koehenkilöt yksinkertaisesti vertaavat annettuja kahta kohdetta. He eivät tunne olevansa sidottuja vastauksiinsa muihin saman näytön kohteisiin.

Koehenkilöillä ei ollut merkittävää suuruusvaikutusta kummassakaan tilassa. Vaikka tämä tulos vaikuttaa optimistiselta, aluevaikutuksen läsnäolo heikentää optimismia käyttää tätä tehtävää arvon kompromissien mittaamiseen. Suuruusvaikutus voi riippua siitä, että rohkaistaan ​​kohdetta käyttämään 0 vertailukohtana. Kun ulottuvuuden molemmat päät on nimenomaisesti ilmoitettu (esim. 120 minuuttia ja 80 minuuttia) - sen sijaan, että jätät implisiittiseksi, että toinen pää on 0 - alueen vaikutukset voivat ottaa vallan.

Koe 3

Kokeet 1 ja 2 osoittavat joko aluevaikutuksia tai suuruusvaikutuksia kokonaisvaltaisessa luokituksessa. Huolimatta Beattien ja Baronin (1991) lupaavista tuloksista, kokonaisvaltaisten luokitustehtävien käyttö ei näytä tarjoavan luotettavaa keinoa johdonmukaisiin kompromissimittauksiin. Sen tarjoamat toimenpiteet näyttävät riippuvan siitä, mitä kohteet käyttävät kunkin asteikon ylä- ja alareferenssipisteenä.

Toinen tapa saada aikaan johdonmukaisia ​​kompromisseja on kohdata vastaaja epäjohdonmukaisuuksiinsa ja pyytää häntä ratkaisemaan ne. Tätä on vaikea tehdä kokonaisvaltaisissa arviointitehtävissä, koska vastaajan olisi käsiteltävä paljon vastauksia kerran. Kun vastaaja tekee suoria suhteellisia arvioita, epäjohdonmukaisuuden ratkaiseminen voi kuitenkin olla helpompaa.

Koe 3 on esimerkki yhdestä menetelmästä, jota voitaisiin käyttää epäjohdonmukaisuuden ratkaisemisessa. Se sisältää hyödyllisyysvälien vertailun. Esimerkkejä mahdollisista aikaväleistä ovat '' ero 60--120 minuutin välillä '', '' 90--120 dollarin ero '' ja '' normaalin terveyden ja täydellisen hiustenlähtön välinen ero ''. kiinnostusta terveyspalveluiden mittaamiseen. Jos esimerkiksi halusimme selvittää, onko syövän kemoterapian hyöty hintansa arvoinen, osa kustannuksista voi olla hoidon sivuvaikutuksia. Tavallinen tapa mitata terveydenhuollon hyötyjä on verrata kaikkea `` normaalin terveyden '' ja `` kuoleman '' väliseen aikaan. Poliitikot päättävät usein, että tällä aikavälillä on sama hyöty kaikille.

Koe 3 koskee tällaisia ​​terveysvälejä kuin aikaa ja rahaa. Kohde arvioi intervallin A hyödyllisyyden suhteessa B: hen, B: n suhteessa C: hen ja A: n suhteeseen C. AC -osuuden tulisi olla AB -osuuden ja BC -osuuden tulo. Tyypillisesti AC -osuus on liian korkea (kuten aiemmin totesin), mikä on eräänlainen epäherkkyys vertailustandardille.

Tässä käytetyssä menetelmässä koehenkilö pakotetaan ratkaisemaan epäjohdonmukaisuus, mutta hänelle ei kerrota, miten se ratkaistaan. Aihe vastaa kolmeen kysymykseen tietokoneen näytöllä. Jos ne ovat epäjohdonmukaisia, painikkeet näkyvät ruudulla jokaisen tuomion vieressä. Kukin painike sanoo `` Lisää '' tai `` Vähennä '' sen mukaan, onko tuomio liian matala vai liian korkea verrattuna kahteen muuhun tuomioon. Jokainen painike nostaa tai laskee siihen liittyvää vastausta yhdellä yksiköllä. Aihe voi tehdä vastauksista johdonmukaiset napsauttamalla mitä tahansa tai kaikkia painikkeita.

Tässä kokeessa käytettiin kolmea eri välin vertailumenetelmää: aika kompromissi (TTO), standardi uhkapeli (SG) ja suora luokitus (kahdessa versiossa, DT ja DP, kuvataan). TTO -menetelmässä koehenkilö arvioi, kuinka monta viikkoa yhdellä terveydentilalla vastasi 100 viikkoa vähemmän vakavalla terveydentilalla. Vastauksen suhde 100: een mitataan vähemmän vakavan terveydentilan hyödyllisyydestä suhteessa vakavampaan, olettaen, että aika ja hyöty lisääntyvät kokonaishyötyksi. SG -menetelmässä koehenkilö antaa todennäköisyyden vakavammasta terveydentilasta, ja tätä pidetään vähemmän vakavan tilan hyödyllisyyden mittana, olettaen, että odotettu hyöty on ratkaiseva. Suora luokitusmenetelmä pyytää yksinkertaisesti välien vertailua.

Vertailtavat välit rakennettiin manipuloimalla joko terveydentilaa tai sen todennäköisyyttä tai kestoa. Jokaista väliä rajoitti normaali terveys toisessa päässä. Kaikkia terveysolosuhteita käytettiin jokaisen aikavälisarjan toisessa päässä, yksi vakavampi ja yksi vähemmän vakava. TTO: n ja DP: n (jossa P tarkoittaa todennäköisyyttä) osalta kolmas ehto oli 50%: n mahdollisuus vähemmän vakavaan terveydentilaan. SG: n ja DT: n (T ajan) osalta kolmas sairaus oli 50 viikkoa vähemmän vakavasta tilasta 100 viikon sijaan.

Ajatus terveydentilan manipuloinnista muuttamalla sen todennäköisyyttä tulee Brunerilta (1999). Bruner oli kiinnostunut mittaamaan eturauhassyövän hoitojen, seksuaalisen impotenssin ja virtsainkontinenssin suurimman sivuvaikutuksen hyötyjä. Hän käytti aika-kompromissimenetelmää. Hän kysyi tutkittavilta itse asiassa, kuinka suuren osan eliniänsä he uhrasivat sen sijaan, että saisivat hoitoa, joka antaisi heille esimerkiksi 80%: n mahdollisuuden impotenssiin tai 40%: n mahdollisuuden. Laajalla todennäköisyysalueella vastaus tähän kysymykseen oli epäherkkä todennäköisyydelle. Koehenkilöiden halukkuus uhrata elinajanodote ei riippunut siitä, oliko impotenssin todennäköisyys 40% tai 80% (vaikka he olivat hieman vähemmän halukkaita, kun se nousi 99%: iin). Tällainen epäherkkyys todennäköisyydelle tekee toimenpiteestä hyödyttömän keinona saada aikaan arvioita impotenssin hyödyllisyydestä.

Kriittinen kysymys on se, jossa verrataan alennettua vähemmän vakavaa terveydentilaa (50% tai 50 päivää) vakavampaan tilaan. Jotta tämä olisi hyvä hyödyllisyysmittari, vastauksen pitäisi olla puolet siitä kysymyksestä, jossa vertaillaan alennettua lievempää tilaa vakavampaan tilaan. Johtaako säätöprosessi tähän tulokseen?

Menetelmä

Kuusikymmentäkolme koehenkilöä täytti kyselylomakkeen Internetissä 3 dollarilla. Koehenkilöt olivat 60% naisia, 51% opiskelijoita ja heidän keski -ikä oli 24 (vaihteluväli: 13-45). Kolme lisäaihetta ei käytetty, koska ne antoivat saman alkuperäisen vastauksen jokaiselle kohderyhmälle.

Tutkimuksen johdanto, nimeltään `` Terveysarvioinnit '', alkoi:

Tämä tutkimus koskee erilaisia ​​tapoja saada aikaan numeerisia arvioita terveyden laadusta. Jos voisimme mitata esimerkiksi terveyslaadun heikkenemistä eri syöpähoitojen sivuvaikutuksista, voisimme auttaa potilaita ja päätöksentekijöitä päättämään, ovatko hoidon hyödyt kustannusten arvoisia.

Sivuvaikutukset on aina kirjoitettu isoilla kirjaimilla. Tässä ovat vaikutukset:

HIUKSET (täydellinen)
NAUSEA (ruoan kulutus puolet normaalista)
DIARRHEA (kolme kertaa päivässä)
Väsymys (tarpeeksi työkyvyttömäksi)
On myös tehosteyhdistelmiä.

Jossain kysymyksessä teet kaksi vaihtoehtoa tasavertaiseksi sanomalla, kuinka paljon aikaa yhdellä sivuvaikutuksella vastaa pidempää aikaa jonkin muun sivuvaikutuksen kanssa, joka ei ole niin paha. Joissakin tapauksissa sivuvaikutukset eivät ole varmoja.

Muista kokeilla harjoitustarvikkeita ennen kuin jatkat.

Yhdessä kysymyksessä annat ajan. Sinun on vastattava numerolla 0 - 20. Käytä vapaasti desimaaleja. Tässä on esimerkki (kuurous):

A. 100 viikkoa kuuroutta.
B. 50 viikkoa sokeuden ja kuuruuden kanssa.

Voit vastata tähän valitsemalla B: lle numeron, jotta molemmat vaihtoehdot ovat yhtä suuret. Yritä valita eri viikkoja B: lle ylös ja alas, kunnes tunnet A: n ja B: n olevan yhtä suuret. Tee tämä nyt napsauttamalla yhtä näistä kahdesta painikkeesta:

Painikkeet oli merkitty `` A on huonompi nyt '' ja `` B on huonompi nyt ''. Yhden painikkeen napsauttaminen sääti laatikon päivien määrää pienemmillä summilla. Seuraava harjoituskohde käyttää todennäköisyyden sijaan aikaa kahden vaihtoehdon rinnastamiseen. Koehenkilöille kerrottiin myös luokituseristä ja heille kerrottiin kohteiden määrä. Lopulta heille kerrottiin:

Kohdat muotoiltiin seuraavasti: S1 oli kahdesta oireesta lievempi ja S2 vakavampi. S1 oli aina yksi neljästä luetellusta oireesta. S2 oli joko kaksi oireista, mukaan lukien S1 (esim. NAUSEA JA FATIGUE, kun S1 oli NAUSEA) tai kaikki neljä. (Jokainen oire esiintyi yhtä usein parin jäsenenä.)

Ajan kompromissi

Täytä jokainen tyhjä niin, että kaksi vaihtoehtoa ovat samat.

A. 50%: n mahdollisuus S1: lle 100 viikon ajan
B. S1 ___ viikon ajan

A. S1 100 viikon ajan
B. S2 ___ viikon ajan

A. 50%: n mahdollisuus S1: lle 100 viikon ajan
B. S2 ___ viikon ajan

Normaali uhkapeli

Täytä jokainen tyhjä niin, että kaksi vaihtoehtoa ovat samat.

A. S1 50 viikon ajan
B. ___% todennäköisyys S1: lle 100 viikon ajan

A. S1 100 viikon ajan
B. ___% todennäköisyys S2: lle 100 viikon ajan

A. S1 50 viikon ajan
B. ___% todennäköisyys S2: lle 100 viikon ajan

Suora tuomio (aika)

Jos normaalin terveyden ja 100 S1 -viikon välinen ero on 100, kuinka suuri ero normaalin terveyden ja S1 -viikon 50 välillä on?

Jos normaalin terveyden ja 100 S2 -viikon välinen ero on 100, kuinka suuri on normaalin terveyden ja 100 S1 -viikon välinen ero?

Jos normaalin terveyden ja 100 S2 -viikon välinen ero on 100, kuinka suuri ero normaalin terveyden ja S1 -viikon 50 välillä on? Suora arviointi (todennäköisyys)

Jos normaalin terveyden ja S1: n ero on 100, kuinka suuri ero normaalin terveyden ja S1: n 50%: n todennäköisyyden välillä on? Kaikki tämän esimerkin oireet ovat 100 viikon ajan.

Jos normaalin terveyden ja S2: n välinen ero on 100, kuinka suuri ero normaalin terveyden ja 100%: n todennäköisyyden välillä on S1?

Jos normaalin terveyden ja S2: n välinen ero on 100, kuinka suuri ero normaalin terveyden ja S1: n 50 prosentin todennäköisyyden välillä on?

Jokaisen vastauslaatikon oikealla puolella oli painike, tyhjä alussa. Kun vastaukset oli täytetty, ohjelma tarkisti ensin, onko kolmas vähemmän kuin muut, ja vaati vastausten muuttamista, jos ei. Sitten ohjelma tarkisti, olivatko ne johdonmukaisia. Johdonmukaisuus määriteltiin kolmen vastauksen suhteen perusteella: kun kaikki vastaukset oli jaettu sadalla, kolmannen vastauksen oli oltava kahden muun tulos lähimpään yksikköön. Jos vastaukset olivat johdonmukaisia, aihe voisi siirtyä seuraavaan näyttöön. Jos kolmas vastaus oli liian korkea, sana `` Lisää '' ilmestyi kahdessa ensimmäisessä painikkeessa ja `` Pienennä '' ilmestyi kolmannessa painikkeessa. Kohde napsautti mitä tahansa kolmesta painikkeesta, kunnes käskettiin jatkaa. Kukin painike sääsi vasteella 1 yksikköä, ylöspäin lisäyksille ja alas laskuille. (Kohde voi myös kirjoittaa vastauksen.) Jos kolmas vastaus oli liian matala, `` Lisää '' ja `` Pienennä '' vaihdettiin. Kohteen oli saatava vastaukset johdonmukaisiksi ennen siirtymistä seuraavaan näyttöön.

Tulokset

Koehenkilöt olivat alun perin epäjohdonmukaisia ​​ja herkkiä todennäköisyydelle ja ajalle, kuten odotettiin. Vaatimus niiden johdonmukaisuudesta teki heistä herkempiä todennäköisyydelle ja ajalle.

Kunkin näytön epäjohdonmukaisuuden mitta oli kolmannen vastauksen ja kahden ensimmäisen vastauksen tulon välisen suhteen logi (pohja 10) (kun kaikki vastaukset on jaettu 100: lla). Tämä olisi 0, jos vastaukset olisivat johdonmukaisia. Keskimääräinen epäjohdonmukaisuus kaikissa neljässä herätysmenetelmässä oli .0245 (t63 = 3.45, p = .0010), mikä tarkoittaa, että kolmas vastaus oli noin 6% liian korkea, laskettuna tällä tavalla. Neljä menetelmää erosivat tämän vaikutuksen koosta (F.3,189 = 5,57, p = 0,0011).

Tärkein epäherkkyyden mitta todennäköisyyteen ja aikaan oli kolmannen vastauksen suhde toiseen, miinus -5. (Normatiivinen standardi oli .5.) Tämä mitta oli odotetusti positiivinen, jos koehenkilöt mukautuvat liian vähän todennäköisyyden ja ajan muutoksiin toisen ja kolmannen vastauksen välillä. Keskiarvo oli .0260 (t63 = 2,96, p = 0,0043). Neljä menetelmää erosivat tämän vaikutuksen koosta (F.3,189 = 6,49, p = .0001): .0145 ajan kompromissille, .0475 uhkapelille, .0284 suoralle arvioinnille (todennäköisyys) ja .0135 suoraajalle. (Huomaa, että näitä eroja ei voida ymmärtää siten, että niihin liittyy ajan ja todennäköisyyden vaikutuksia.)

Vastaus ensimmäiseen kysymykseen ei poikennut merkittävästi kokonaisuudesta .5, vaikka neljä menetelmää eroavat toisistaan ​​(F.3,189 = 5,33, p = 0,0015), keskiarvolla 0,4714 ajan kompromissille, .5083 tavalliselle uhkapelille, .5042 suoralle ajalle ja .5106 suoralle todennäköisyydelle.

Suurin kiinnostuksen tulos koski toisen ja kolmannen kysymyksen suhdetta. Olisi pitänyt olla .5, mutta sen keskiarvo oli kaikissa menetelmissä, kuten todettu, liian korkea .0260. Johdonmukaisuuden säätämisen jälkeen keskiarvo oli .0050, ei merkittävästi erilainen kuin 0. Muutos oli merkittävä (t63 = 3,65, p = .0005). Tämä tulos voi kuitenkin syntyä keinotekoisesti, jos kolmannen vastauksen säätöpainike sanoi Vähennä useammin kuin se sanoi Lisää, olettaen, että muutoksen suunta ei vaikuttanut muutoksen suuruuteen. Näin ollen laskin lisäyksen ja vähennyksen kokeiden mittauksen erikseen. Vähennystutkimusten keskimääräinen muutos oli .0842 (alaspäin) ja lisäyskokeiden keskiarvo oli .0479 (ylöspäin). Niillä 52 potilaalla, joilla oli tietoja molemmista tapauksista, keskimääräinen ero näiden välillä oli .0382. Toisin sanoen alaspäin suuntautuva muutos oli suurempi kuin ylöspäin suuntautunut muutos, joten kokonaisuutena aiheista tuli johdonmukaisempia (t51 = 3,36, p = 0,0015). Säädön hyöty ei siis johdu vain siitä, että kohteet pakotetaan liikkumaan vaadittuun suuntaan. Kun heidät pakotettiin liikkumaan tähän suuntaan, he liikkuivat enemmän kuin silloin, kun heidän oli pakko liikkua vastakkaiseen suuntaan. He siirtyivät myös useammin entiseen suuntaan (66% mahdollisista tapauksista vs. 56% t51 = 1,76, p = .0422, yksi pyrstö).

Koe 4

Koe 4 havainnollistaa toista lähestymistapaa johdonmukaisuuden säätämiseen. Koehenkilöille annetaan arvio siitä, mitä heidän vastauksensa olisivat, jos he olisivat johdonmukaisia. Toisin kuin kokeessa 3, tutkittavien ei tarvitse säätää vastauksiaan. Heille annetaan oikaistut vastaukset vain ehdotuksena. Kysymys on siitä, hyväksyvätkö he ehdotuksen ja ovatko he johdonmukaisempia.

Kokeessa 4 käytettiin kolmea eri terveydentilaa sen sijaan, että käytettäisiin kahta terveydentilaa, joista toinen oli diskontattu. Se käytti vain kahta menetelmää, ajan kompromissia ja suoraa luokitusta.

Menetelmä

58 tutkittavaa vastasi kyselylomakkeen Internetissä 5 dollarilla. Koehenkilöt olivat 65% naisia, 38% opiskelijoita ja heidän mediaani -ikänsä oli 27 (vaihteluväli: 12-69).

Tutkimuksen johdanto, nimeltään `` Terveysarvioinnit '', alkoi:

Tämä tutkimus koskee erilaisia ​​tapoja saada aikaan numeerisia arvioita terveyden laadusta. Jos voisimme mitata terveydentilan heikkenemistä eri olosuhteista, voisimme mitata näiden sairauksien hoidon tai ehkäisemisen hyödyt. Tämä mahdollistaisi resurssien tehokkaamman kohdentamisen.

Ehdot, joita harkitsemme ovat:
LÄHIYTTÄVYYS (tarvitaan silmälaseja)
SOKEUS YHDESSÄ SILMÄSSÄ
SOKEUS TOTAL
OSAPUOLINEN KUUROUS (kuulokoje palauttaa normaalin kuulon)
Kuurous yhdessä korvassa (täydellinen, kuulokoje ei auta)
KOKO KUURAUS
Kävelyn menetys yhdellä jalalla
Kävelyn menetys molemmissa jaloissa
KAIKEN RAJOJEN PARALYYSI
LEIKKAUS INDEKSI SORMASSA (hallitseva käsi)
SPLINT ON HAND (hallitseva puoli)
SPLINT ON ARM (hallitseva puoli) CAST ON JALKA
VALITSE JALALLA
KÄYTÄ Kummassakin jalassa
KULMAKULMAT
HIUKSEN HÄVITTÄMINEN KASVOLTA JA PÄÄTÄ
KAIKKI HIUKSET (mukaan lukien kasvot ja pää)

Huomaa, että nämä olosuhteet ovat kuudessa kolmen hengen ryhmässä. Kussakin ryhmässä olosuhteet on järjestetty vakavuuden mukaan. Koehenkilön oli tehtävä aika-kompromissiharjoituksia ennen aloittamista, kuten viimeisessä kokeessa. Heille kerrottiin myös luokituseristä. Heille kerrottiin kysymysten määrä ja heitä kannustettiin käyttämään desimaaleja vastauksissaan.

Ensimmäiset 36 tutkimusta sisälsivät 18 aika-kompromissituomiota ja 18 suoraa tuomiota. Jokainen aika-kompromissi-esite otettiin käyttöön `` Kuinka monta päivää tekee näistä kahdesta tuloksesta saman? '' Suoran tuomion kohteet muotoiltiin samalla tavalla kuin käytännön kohde.

Koehenkilö teki jokaisen arviointityypin kolme kertaa kunkin kuuden ehtoryhmän osalta. Kussakin olosuhteiden ryhmässä kohde vertasi ensimmäistä ja toista, ensimmäistä ja kolmatta ja toista ja kolmatta. S1 ja S2 edustavat näin ollen arvioitavia olosuhteita, esim. `` SINÄSYYS YHDESSÄ SILMÄSSÄ '' ja `` TOTAL BLINDNESS ''. Käyttämällä kaikkia kolmea vertailua voisin testata sisäisen johdonmukaisuuden. Erityisesti ääripäiden arvioinnin (ensin suhteessa kolmanteen) tulisi olla kahden muun tuomion tulos (suhteina). Nämä 36 tutkimusta esitettiin satunnaisessa järjestyksessä, kukin omalla näytöllä, joka katosi, kun koehenkilö vastasi.

Näiden 36 kokeen jälkeen koehenkilö näki 24 näyttöä, joissa oli kolme tuomiota näytölle, jälleen satunnaisessa järjestyksessä. Nämä koostuivat kahdentyyppisistä tuomioista, joista jokainen oli koulutettu ja kouluttamaton versio, kuhunkin olosuhteiden ryhmään.

Sekä koulutetuissa että kouluttamattomissa olosuhteissa jokainen näyttö alkoi: '' Vastaa kaikkiin kolmeen kohtaan uudelleen annetuissa laatikoissa. Sinun ei tarvitse antaa samaa vastausta kuin antamasi, eikä sinun tarvitse tehdä vastauksistasi johdonmukaisia. Yritä saada vastauksesi heijastamaan todellista harkintaasi. ''

Koulutetun suoran tuomion tilassa seuraavassa kappaleessa lukee: `` Toinen sarake näyttää yhden tavan saada vastauksesi suhteet yhteen. Toisen rivin prosenttiosuus on ensimmäisen ja kolmannen rivin prosenttiosuuden tulo. Koulutetussa aika-kompromissitilassa viimeisessä virkkeessä lukee: `` Päivien toisen rivin suhde (100: een) on ensimmäisen ja kolmannen rivin suhteiden tulos. Tämä olettaa, että kaikki päivät lasketaan yhtä paljon. ''

Koehenkilö näki sitten taulukon, jossa oli vasemmalla olevat kohteet ja joko kaksi tai kolme numerosaraketta, esimerkiksi:

Ajan kompromissiksi vasemmassa yläkulmassa olisi lukenut: `` 100 päivää KUURAUTUMISTA YHDESSÄ KORVASSA oli yhtä huono kuin 5 päivää OSALLISTA VAHVUUTTA '', ja toisessa sarakkeessa olisi päiviä prosenttilukujen sijaan. Kouluttamattomassa tilassa toinen sarake jätettiin pois. Viitataan kolmeen vertailuun AB, BC ja AC kolmella rivillä. AB ja BC ovat vierekkäin ja AC on äärimmäinen.

Toisen sarakkeen yhdenmukaiset arvot laskettiin kahden vierekkäisen vertailun suhteen säilyttämiseksi ja muutoin vastausten yhdenmukaistamiseksi. Kaksi vierekkäistä vertailua (AB ja BC) kerrottiin korjauskertoimella ja äärimmäinen vertailu (AC) jaettiin samalla kertoimella. (Korjauskertoimen ei rajoitettu olevan suurempi tai pienempi kuin yksi.) Erityisesti korjauskerroin oli [AC/(AB ·BC)] 1/3. Oikeat arvot pyöristettiin lähimpään yksikköön, mutta tutkittavaa kehotettiin käyttämään desimaaleja.

Tulokset

Laskin kullekin ehtoryhmälle epäjohdonmukaisuuden mittauksen: log10[AC/(AB ·BC)]. (Suhteen suunta on mielivaltainen. Se voitaisiin kääntää. Loki varmistaa, että inversio vaikuttaisi vain epäjohdonmukaisuuden merkkiin, ei sen suuruuteen.) Laskin tämän mittauksen keskiarvon kuuden ehtojoukon osalta kullekin kahdelle menetelmälle , alkuvaiheessa, koulutetuissa ja kouluttamattomissa olosuhteissa. Laskin myös absoluuttisen arvon epäjohdonmukaisuusmittarin kullekin ehtoryhmälle ja keskiarvoin sen samalla tavalla. Taulukko 4 esittää näiden kahden toimenpiteen keskiarvot molemmille menetelmille.

Taulukko 4.
Keskimääräiset epäjohdonmukaisuusmittarit molemmille menetelmille.

Koulutetut kohteet olivat johdonmukaisempia kuin kouluttamattomat, jotka puolestaan ​​olivat johdonmukaisempia kuin alkuperäiset, sekä allekirjoitetuilla että absoluuttisilla mittareilla. Testasin tämän neljällä varianssianalyysillä, joista yksi oli alustava vs. kouluttamaton ja toinen kouluttamaton vs. koulutettu, kumpaakin epäjohdonmukaisuusmittaa varten. On tarpeetonta vertailla peruskoulutusta ja koulutusta. Mutta alkuvaiheen ja kouluttamattoman vertailu testaa (sekavat) vaikutukset, kun esineet tehdään yhdessä ryhmässä ja tehdään ne toisen kerran. Alkuperäinen vs. kouluttamaton vaikutus oli merkittävä allekirjoitetuille toimenpiteille (F.1,57 = 68,2, p = 0,0000) ja allekirjoittamattomille mittauksille (F1,57 = 62,0, p = 0,0000). Aika-kompromissin ja suoran tuomion vaikutus oli merkittävä vain absoluuttisille mittareille (F.1,57 = 17,9, p = .0001): aika-kompromissi oli vähemmän johdonmukainen. Kummassakaan tapauksessa vuorovaikutus menetelmän ja alkuperäisen vs. kouluttamattoman välillä ei ollut merkittävää. Parannus, joka johtui esineiden esittämisestä yhdessä ja uudelleen, oli läsnä molemmissa menetelmissä.

Epäjohdonmukaisuus oli pienempi koulutetuilla kuin kouluttamattomilla sekä allekirjoitetuilla että allekirjoittamattomilla toimenpiteillä (F.1,57 = 8,14, p = 0,0060 ja F1,57 = 51,6, p = 0,0000). Menetelmän vaikutus oli jälleen merkittävä vain absoluuttiselle mittaukselle (F.1,57 = 13,1, p = .0006). Koulutuksen ja menetelmän välinen vuorovaikutus ei ollut merkittävä. Harjoittelu parantaa johdonmukaisuutta molemmissa menetelmissä.

Keskustelu

Kaksi ensimmäistä kokeilua täydentävät olemassa olevia esityksiä siitä, että kokonaisvaltaisiin luokituksiin kohdistuu joskus vieraita vaikutuksia aluevaikutusten tai suuruusvaikutusten muodossa. Voimme ottaa nämä vaikutukset huomioon yleensä olettaen, että koehenkilöt ottavat kullekin ulottuvuudelle kaksi vertailupistettä, ylhäältä ja alhaalta, ja arvioivat kohteen sijainnin suhteessa näihin vertailupisteisiin, ainakin osan ajasta. Toisin sanoen he ajattelevat vaihtelua ulottuvuutta pitkin suhteena etäisyydestä ylhäältä alas eikä absoluuttisena muutoksena ulottuvuudella, jonka yksiköillä on oma arvo. Tämä on joskus järkevä arviointimenetelmä, esimerkiksi arvioitaessa tenttiarvioita. Mutta sitä käytetään myös silloin, kun kohde voi arvioida yksiköt itsenäisesti.

Ylä- ja alaosa on hieman vaihteleva ja riippuu tehtävän yksityiskohdista. Kokeessa 1 havaittiin suuruusvaikutuksia kokonaisvaltaisissa luokituksissa, WTP: ssä ja eroarvioinnissa ajan ja rahan kompromississa. Se havaitsi aluevaikutuksia WTP: ssä ja eroarvioinnissa, mutta ei kokonaisvaltaisissa luokituksissa. Kuten on todettu, luokitustehtävä on saattanut poiketa muista tehtävistä siinä mielessä, että koehenkilöt olisivat voineet helpommin ottaa nollan käyttöön epäsuorana alarajana.

Kokeessa 2 käytettiin neljää kohdetta kerrallaan, ja kaksi ensimmäistä kohdetta määrittivät alueen. Se havaitsi aluevaikutuksia, kun koehenkilöt arvioivat kohteita yksi kerrallaan, mutta eivät silloin, kun he vertasivat yhtä kohdetta toiseen kysymyksessä. Mahdollinen selitys tälle tulokselle on, että vertailumuoto tarjoaa oman kontekstinsa, joten aiheet jättävät kontekstin huomiotta aiemmissa kysymyksissä. Jos näin on, suora vertailu voi olla hyödyllinen aluevaikutusten voittamisessa. Tämä johtopäätös olisi samanlainen kuin Fischerin (1995). Huomaa kuitenkin, että suora vertailu muistuttaa suuresti kokeissa 3 ja 4 käytettyjä suoria arviointitehtäviä.

Näissä kokeissa koehenkilöt vertasivat kahta aikaväliä sen sijaan, että tekisivät tuomion yhdestä kahden ominaisuuden ärsykkeestä. Kuten aiemmissa tutkimuksissa (Baron et ai., 1999 Ubel et al., 1996) todettiin, kaikki nämä toimenpiteet osoittivat suhteen epäjohdonmukaisuutta: koehenkilöt eivät antaneet tarpeeksi pieniä lukuja, kun he vertasivat pientä aikaväliä paljon suurempiin (tai päinvastoin) , he eivät antaneet muissa vastauksissaan tarpeeksi suuria lukuja). Kun tämä epäjohdonmukaisuus kiinnitettiin heidän tietoonsa, vastauksista tuli johdonmukaisempia. Tämä on suositeltu lähestymistapa sovellettuihin päätöksentekoanalyyseihin, ja toistaiseksi se näyttää toimivan ainakin siinä mielessä, että se antaa käyttökelpoisia ja johdonmukaisia ​​vastauksia.

Kokonaisvaltaisilla arvioilla on muita ongelmia. Kun vastaajia pyydetään arvioimaan usean ominaisuuden ärsykkeitä useilla ominaisuuksilla, he näyttävät osallistuvan vain muutamaan ominaisuuteen, jotka he pitävät erityisen tärkeinä, jättäen siten huomiotta vähemmän tärkeät ominaisuudet liikaa (Hoffman, 1960, kuvat 3-7 von Winterfeldt & amp; Edwards , 1986, s. 365). Tämä on kuitenkin todennäköisesti vähemmän vakava ongelma, kun vastaajat arvioivat kahta ominaisuutta kerrallaan. Silti alue- ja suuruusvaikutusten olemassaolo näyttää olevan vaikea välttää. Ainoa tapa välttää se näyttää olevan esittää selvät välit vertailua varten.

Tämä väite on johdonmukainen Birnbaumin ja hänen kollegoidensa (1978 Birnbaum & amp; Sutton, 1992) havainnon kanssa, jonka mukaan koehenkilöt, joita pyydettiin arvioimaan kahden ärsykkeen suhdetta (epälineaarisella vastefunktiolla) ärsykkeiden väliseen eroon pikemminkin kuin suhde etäisyydet nollasta (ei stimulaatiota, aistitehtävässä). Kuitenkin, kun aiheita pyydetään erojen suhteet - esim. mikä on suhde hyötyosuuden (tai äänenvoimakkuuden jne.) välillä A: n ja B: n välillä sekä C: n ja D: n välinen ero? - he perustavat vastauksensa erojen suhteeseen eivätkä eroihin. Näyttää siltä, ​​että kahden ärsykkeen suhdetehtävä sisältää neljä ärsykettä, koska viitepiste on implisiittinen, esim. Nolla äänenvoimakkuutta tai normaali terveys. Birnbaumin tuloksen voidaan kuitenkin olettaa viittaavan siihen, että meidän on ilmoitettava vertailukohta nimenomaisesti, jos haluamme aiheiden käyttävän sitä, joten teemme tämän, kun kysytään eroista.

Vertailukelpoisten alueiden loppujen ilmoittaminen on yksiselitteinen päätösanalyysin määräyksistä (Fischer, 1995), mutta sitä ei käytetä rutiininomaisesti muissa arvonmuodostustehtävissä. Tässä raportoidut tulokset viittaavat siihen, että tällainen selkeys aikavälien vertailussa on hyvä lähtökohta arvon saamiseksi. Loput prosessista edellyttävät johdonmukaisuuden tarkistamista ja vastaajien pyytämistä tekemään muutoksia. Tässä käytetyt tarkistukset ovat vain esimerkkejä monista muista, joita voitaisiin käyttää.

Viitteet

Baron, J. (1994). Miettii ja päättää (2. painos). New York: Cambridge University Press.

Baron, J. (1997a). Poikkeamat julkisten päätösten arvojen kvantitatiivisessa mittaamisessa. Psykologinen tiedote, 122, 72-88.

Baron, J. (1997b). Suhteellisen ja absoluuttisen riskin sekaannus arvioinnissa. Journal of Risk and Uncertainty, 14, 301-309.

Baron, J., & amp; Greene, J. (1996). Määrittämättömyyden määräävät tekijät julkisten hyödykkeiden arvioinnissa: panos, lämmin hehku, budjettirajoitukset, saatavuus ja näkyvyys. Journal of Experimental Psychology: Sovellettu, 2, 107-125.

Baron, J., Wu, Z., Brennan, D. J., Weeks, C., & amp; Ubel, P. A. (1999). Analoginen asteikko, suhdearviointi ja henkilöiden kompromissi hyödyllisyysmittauksina: harhat ja niiden korjaaminen. Käsikirjoitus.

Beattie, J., & amp; Baron, J. (1991). Ärsykealueen vaikutuksen määrittelyn painoon tutkiminen. Journal of Experimental Psychology: Human Perception and Performance, 17, 571-585.

Birnbaum, M. H. (1978). Psykologisen mittaamisen erot ja suhteet. Julkaisussa N.Castellan & amp.Restle (toim.), Kognitiivinen teoria, (Osa 3, s. 33-74). Hillsdale, NJ: Erlbaum.

Birnbaum, M. H., & amp; Sutton, S. E. (1992). Asteikon lähentyminen ja hyötymittaus. Organisaation käyttäytyminen ja ihmisen päätöksentekoprosessit, 52, 183-215.

Bruner, D. W. (1999). Eturauhassyövän hoidon mieltymysten ja apuohjelmien määrittäminen. Väitös, Sairaanhoitajakoulu, Pennsylvanian yliopisto.

Darke, P. R., & amp; Freedman, J. L. (1993). Päättäminen, etsitkö kauppaa: Sekä määrän että prosentin vaikutukset. Journal of Applied Psychology, 78, 960-965.

Fischer, G. W. (1995). Ominaisuuspainojen alueherkkyys monen määritteen arvomalleissa. Organisaation käyttäytyminen ja ihmisen päätöksentekoprosessit, 62, 252-266.

Green, P. E., & amp; Srinivas an, V. (1990). Yhteisanalyysi markkinoinnissa: Uutta kehitystä, joka vaikuttaa tutkimukseen ja käytäntöön. Journal of Marketing, 45, 33-41.

Green, P. E., & amp. Wind, Y. (1973). Multiattribute -päätökset markkinoinnissa: Mittausmenetelmä. Hinsdale, IL: Dryden Press.

Hoffman, P. J. (1960). Kliinisen arvioinnin paramorfinen esitys. Psykologinen tiedote, 57, 116-131.

Hsee, C. K. (1996). Arvioitavuushypoteesi: Selitys vaihtoehtojen yhteisen ja erillisen arvioinnin välisistä mieltymysten muutoksista. Organisaation käyttäytyminen ja ihmisen päätöksentekoprosessit, 46, 247-257.

Jones-Lee, M. W., Loomes, G., & amp; Philips, P. R. (1995). Ei-kuolemaan johtavien liikennevammojen ehkäisemisen arvostaminen: ehdollinen arvostus vs. tavalliset uhkapelit. Oxfordin talouspaperit, 47, 676 ym.

Keeney, R. L. (1992). Arvokeskeinen ajattelu: polku luovaan päätöksentekoon. Cambridge, MA: Harvard University Press.

Keeney, R. L., & amp; Raiffa, H. (1993). Päätökset, joilla on useita tavoitteita. New York: Cambridge University Press (alunperin julkaisija Wiley, 1976).

Louviere, J. J. (1988). Yksilöllisen päätöksenteon analysointi: Metrinen yhteinen analyysi. Newbury Park, Kalifornia: Sage.

Lynch, J. G., Jr., Chakravarti, D., & amp; Mitra, A. (1991). Kontrastivaikutukset kuluttaja -arvioinneissa: Muutokset arviointiasteikon ankkuroinnissa. Journal of Consumer Research, 18, 284-297.

Mellers, B. A., & amp Cooke, A. D. J. (1994). Kompromissit riippuvat ominaisuuksien alueesta. Journal of Experimental Psychology: Human Perception and Performance, 20, 1055-1067.

Tversky, A., & amp; Kahneman, D. (1981). Päätösten muotoilu ja valinnan psykologia. Tiede, 211, 453-458.

Ubel, P. A., Loewenstein, G., Scanlon, D., & amp. Kamlet, M. (1996). Yksittäiset apuohjelmat ovat ristiriidassa annosteluvalintojen kanssa: Osittainen selitys siitä, miksi Oregonin kustannustehokkuusluettelo epäonnistui. Lääketieteellinen päätöksenteko, 16, 108-116.

von Winterfeldt, D., & amp; Edwards, W. (1986). Päätösanalyysi ja käyttäytymistutkimus. Cambridge University Press.

Weber, M., & amp; Borcherding, K. (1993). Käyttäytymisvaikutukset painopäätöksiin monen jaon päätöksenteossa. European Journal of Operations Research, 67, 1-12.

Alaviitteet:

1 Tätä tutkimusta tukee N.S.F. apuraha SBR95-20288 ja Pennsylvanian yliopiston syöpäkeskuksen apuraha.

Tiedosto on käännetty kielestä T E X kirjoittanut: T. T H, versio 2.20.
3. heinäkuuta 1999, klo 16.35.


5. Aspiraatiomittauksen käytettävyyden, luotettavuuden ja pätevyyden testaus

Tässä osassa esitetään empiirinen strategia, jolla testataan ehdotettujen välineiden riittävyyttä pyrkimysten mittaamiseen. Erityisesti välineistöä arvioitiin seuraavasti: Tätä tarkoitusta varten toteutettiin tarkoituksella suunniteltu pilottitutkimus 16 Etiopian keskiosan kylässä, jotka oli koottu Debre Berhanin kaupungin ympärille. Otokseen valitut henkilöt olivat kaikki kotitalouksien jäseniä, joita haastateltiin toistuvasti Etiopian maaseudun kotitaloustutkimuksessa (ERHS) viimeisten 20 vuoden aikana. ERHS -tietojen käyttö mahdollisti tarkoituksenmukaisen otannan eri sukupuolten, koulutustasojen ja ikäryhmien yksilöistä. Tätä tarkoitusta varten rakensimme 60 otosluokkaa yksilöitä, joista jokainen on ainutlaatuinen yhdistelmä eri koulutustasoja (5 tasoa), sukupuolta (2 tasoa) ja ikää (6 tasoa). Valitsimme kustakin kylästä yksilöitä, joille löysimme vähintään kaksi samaan luokkaan kuuluvaa yksilöä ERHS -näytteestä. Jokaisen valitun yksilön osalta otoksessamme on siis vähintään yksi saman kylän asukas, joka kuuluu samaan ikäryhmään, jolla on samanlainen koulutustaso ja samaa sukupuolta. Kaiken kaikkiaan kysely kattoi 170 yksilöä 16 kylässä, tai puuttuvia tietoja tietyistä muuttujista tarkoittaa, että vain 155 havaintoa voidaan käyttää tehokkaasti kaikissa alla olevissa testeissä lukuun ottamatta ankkurointitestia, jossa 20 vastaajaa kieltäytyi keskustelemasta vertaistason tavoitteista.

Käytettävyys: Voidaanko sitä hallinnoida vakiotutkimuksissa? Ovatko vastaajat valmiita vastaamaan tällaisiin kysymyksiin?

Luotettavuus: Voidaanko luottaa johdonmukaisten pyrkimysten mittaamiseen toistuvissa sovelluksissa? Missä määrin saadut vastaukset riippuvat laskentakapasiteetista ja/tai kyselylomakkeesta?

Voimassaolo: Mittaako se tehokkaasti toiveita ja vain toiveita? Ovatko saadut vastaukset toiveiden ja vastaavan tulevaisuuteen suuntautuvan käyttäytymisen odotettavissa olevien tekijöiden mukaisia? Miten kokonaisindikaattori toimii verrattuna yhden ulottuvuuden indikaattoreihin? Pitäisikö aggregointiprosessissa käyttää yksilöllistä painotusjärjestelmää?

Toistettavuus: Miten se onnistuu muissa yhteyksissä? Ovatko tässä löydetyt tulokset yhdenmukaisia ​​muualla samankaltaisia ​​mittauksia käyttävien tulosten kanssa?

Kyselylomake oli lyhyt ja suunniteltu ainoastaan ​​tätä pyrkimystoimenpiteiden kokeiluarviointia varten. Se sisälsi edellä kuvatut pyrkimyksiin liittyvät kysymykset, jotka kattoivat neljä ulottuvuutta: vuositulot, vauraus (tuottamattomien varojen osalta), koulutus ja sosiaalinen asema yhteisössä-jälkimmäisen ottaa huomioon kylän yksilöiden osuus neuvoja ennen kuin teet tärkeän päätöksen. Kuvassa 1 esitetään käytetyn aspiraatiomoduulin asettelu. Nämä kysymykset esitettiin vastaajille itselleen ja vertaisilleen, jotka määriteltiin toiseksi henkilöksi samassa kylässä, jolla on samanlaiset ikä-, sukupuoli- ja koulutusominaisuudet.


Materiaalit ja menetelmät

Nottinghamin yliopiston kauppakorkeakoulun tutkimusetiikan komitea hyväksyi tämän tutkimuksen. Tutkimus tehtiin Amazon Mechanical Turkilla (http://www.mturk.com). Mturk on joukkoliikennettä tarjoava Internet-pohjainen markkinapaikka, joka helpottaa "työntekijöiden" palkkaamista lyhyiden online-töiden suorittamiseen (kutsutaan HIT-"Human Intelligence Tasks") [14–16]. MTurk on suosittu tutkimuksen tekemisessä, koska sillä on laaja aihepooli, joka on monipuolisempi kuin tyypillinen perustutkintoaine. Vaikka se ei ole täysin edustava (amerikkalaista) väestöä yleensä, se on edustavampi kuin puhtaasti perustutkinto -aihealueet ja tarjoaa erittäin kustannustehokkaan reitin suuriin tietojoukkoihin [17–20]. Ja mikä tärkeintä, se tarjoaa laatutietoa useiden tutkimusten mukaan, joissa MTurk -näytteitä verrattiin perinteisempiin laboratorionäytteisiin, joissa kokeellinen valvonta on tyypillisesti vahvempaa kuin MTurkilla [16, 19–21].

Kaikilta osallistujilta saatiin tietoinen suostumus verkossa (ennen kuin he lopulta päättivät osallistua osallistujille kerrottiin seuraavaa: "Hyväksymällä tämän HIT: n annat meille tietoisen suostumuksen siihen, että voimme käyttää vastauksiasi anonyymissä muodossa vain tutkimustarkoituksiin.").

Kun osallistujat olivat hyväksyneet HIT: n, he lukivat seuraavan johdantokappaleen: "Tässä HIT: ssä pyydämme teitä vastaamaan ihmissuhteiden luonnetta koskevaan kyselyyn. Kiinnostuksemme on täysin tieteellinen. Kaikki vastaukset käsitellään luottamuksellisesti ja niitä käsitellään vain raportoitu yhteenlasketussa tilastollisessa muodossa. Tässä kyselyssä ei ole oikeita tai vääriä vastauksia. Olemme kiinnostuneita vain rehellisestä arvioinnistasi. Jos tunnet olosi epämukavaksi vastaamalla joihinkin kysymyksiin, sinulla on mahdollisuus valita vastaus "älä halua vastata". "

Yhteensä 772 henkilöä, jotka kaikki rekrytoitiin MTurkista ja Yhdysvaltojen asukkaista, osallistuivat kolmeen tutkimukseemme. Tutkimukset tehtiin helmikuun ja heinäkuun 2014 välisenä aikana. Osallistujiemme keski -ikä oli 34 vuotta (s.d. 11) ja noin 46% oli naisia. Sitä vastoin vertailututkimuksemme osallistujat olivat opiskelijoita, joiden keski -ikä oli noin 19 vuotta. Kolmen tutkimuksen aikana naisten osuus vaihteli 52%: sta 78%: iin. Osallistumispäätöksen jälkeen kohteet ohjattiin kyselykysymyksiin ulkoisella verkkosivulla. Kysely koodattiin Qualtrics -kyselyohjelmistolla (http://www.qualtrics.com/). Kyselykysymykset ovat saatavilla osana tämän asiakirjan tukitietoja (S1 -teksti). Osallistujat saivat osallistumisesta kiinteän maksun (yksityiskohdat on esitetty opintojen kuvauksessa).

Osallistujat esiteltiin ensin tutkimuksen aiheeseen ja heille kerrottiin, että kyse on suhteiden luonteen ymmärtämisestä (katso yllä). Heitä pyydettiin sitten keskittymään yhteen tiettyyn henkilöön (tarkat säännöt vaihtelivat täällä raportoimiemme tutkimusten välillä). Osallistujia pyydettiin tunnistamaan tämä henkilö etunimen alkukirjaimen perusteella. Osallistujille kerrottiin sitten seuraavaa:

"Seuraavassa kuvassa pyydämme sinua harkitsemaan, mikä näistä ympyräparista kuvaa parhaiten suhdettasi [tämän henkilön] kanssa kaikissa seuraavissa kysymyksissä. Kuvassa" X "toimii paikkamerkkinä [tälle henkilölle], eli sinun pitäisi ajatella, että "X" on [tämä yksilö]. Valitsemalla sopivan numeron ilmoita, missä määrin sinä ja [tämä henkilö] olette yhteydessä. "

Näytöllä IOS -tehtävä esitettiin täsmälleen kuten kuvassa 1. Osallistujien oli valittava vastaus yksinkertaisella napsautuksella, mutta he voivat myös ilmoittaa, että he eivät halunneet vastata.

Saimme myös aikaan kaksi muuta kirjallisuudessa ehdotettua toimenpidettä suhteiden läheisyyden mittaamiseksi. Ensinnäkin Cialdini et ai. [22], heti IOS -asteikon saamisen jälkeen lisäsimme "We Scale". Tarkka sanamuoto oli seuraava: "Ole hyvä ja valitse alla oleva numero osoittaaksesi, missä määrin käyttäisit termiä" ME "luonnehtiessasi sinua ja [tätä yksilöä]. Vastaukset olivat 7-asteikolla (1 =" ei ollenkaan "7 =" hyvin paljon "). IOS-asteikon ja" We-Scalen "välinen keskiarvo muodostaa mitta, jota Cialdini ym. [22] kutsuvat" ykseydeksi ".

  1. "Suhteessa kaikkiin muihin suhteisiisi (sekä samaan että vastakkaiseen sukupuoleen) miten luonnehtisit suhdettasi X: ään?"
  2. "Suhteessa siihen, mitä tiedät muiden ihmisten lähisuhteista, miten luonnehtisit suhdettasi X: ään?"

Vastaukset olivat 7-asteikolla, jossa 1 = "ei lähellä" ja 7 = "hyvin lähellä". SCI on yksinkertaisesti pisteiden summa.

IOS -asteikkoa, We -asteikkoa ja SCI -asteikkoa käytetään kaikissa kolmessa tutkimuksessa. Tutkimus 1 vertaa niitä RCI: hen. Raakatiedot ovat saatavana tukitiedostona S1 -tietojoukko (Excel -muodossa).

Päätämme kattavan IOS -asteikon arvioinnin uudella pääkomponenttien analyysillä, jota käytämme "Suhteen läheisyyden indeksin" johtamiseen. Tämä indeksi on kattava vertailukohtamme IOS -asteikolle.


Pääsyvaihtoehdot

Osta yksi artikkeli

Välitön pääsy koko artikkeliin PDF.

Veron laskenta viimeistellään kassalla.

Tilaa päiväkirja

Välitön pääsy kaikkiin numeroihin vuodesta 2019 alkaen. Tilaus uusitaan automaattisesti vuosittain.

Veron laskenta viimeistellään kassalla.


Kiitokset

Tutkimuksen 1 tiedot saatiin Joint Advertising, Market Research & amp Studies (JAMRS) -ohjelmasta. Tämän artikkelin näkemykset, mielipiteet ja havainnot ovat yksinomaan kirjoittajien näkemyksiä, eikä niitä tule tulkita Yhdysvaltain puolustusministeriön viralliseksi kannaksi, politiikaksi tai päätökseksi, ellei toisin ole mainittu muissa asiakirjoissa. Osia tästä asiakirjasta esiteltiin teollisen ja organisaatiopsykologian yhdistyksen vuoden 2010 vuosikokouksessa, Chicago, IL. Kirjoittajat haluavat kiittää M. Gloria Gonzalez-Moralesia hänen avustaan ​​tämän hankkeen aiemmissa versioissa. Kirjoittajat haluavat myös kiittää Samantha Baardia hänen avustaan ​​tutkimuksen 2 verkkokyselyn ohjelmoinnissa.


Psykologinen "itsensä ja muiden päällekkäisyys" ja tuki orjuuden korvauksille

Neurobiologiset ja sosiaalipsykologiset tutkimukset viittaavat siihen, että on olemassa tiedostamaton "itsensä ja muiden päällekkäisyyksien" olemassaolo, joka voi johtaa yksilöihin samaistumaan muihin yksilöihin tai ryhmiin. Tässä asiakirjassa tutkitaan, voisiko tämä vaikutus auttaa selittämään joidenkin valkoisten tuen muuten epäsuositulle politiikalle afroamerikkalaisten orjuuden korvausten puolesta. Edustava puhelinkysely (n = 1200) toimii vertailun lähtökohtana online-reaktioaikatutkimuksessa, jossa ei ole edustava näyte (n = 1341), joka mittaa "itsensä ja muiden päällekkäisyyksiä" (viitaten "epäsuoraan läheisyyteen" mustien kanssa). Osittaiset suhteelliset kertoimet tilatut logit -analyysit paljastavat implisiittisen läheisyyden mustien kanssa valkoisten vastaajien keskuudessa tehokkaimpana hyvitysten ennustajana. Epäsuoran läheisyyden absoluuttisen vaikutuksen suuruus ylittää perinteisten ennustajien, kuten rodun kauna, ideologia ja puolueiden tunnistaminen. Keskustellaan metodologisista ja poliittisista vaikutuksista.


Materiaalit ja menetelmät

Nottinghamin yliopiston kauppakorkeakoulun tutkimusetiikan komitea hyväksyi tämän tutkimuksen. Tutkimus tehtiin Amazon Mechanical Turkilla (http://www.mturk.com). Mturk on joukkoliikennettä tarjoava Internet-pohjainen markkinapaikka, joka helpottaa "työntekijöiden" palkkaamista lyhyiden online-töiden suorittamiseen (kutsutaan HIT-"Human Intelligence Tasks") [14–16]. MTurk on suosittu tutkimuksen tekemiseen, koska sillä on laaja aihepooli, joka on monipuolisempi kuin tyypillinen perustutkintoaine. Vaikka se ei ole täysin edustava (amerikkalaista) väestöä yleensä, se on edustavampi kuin puhtaasti perustutkinto -aihealueet ja tarjoaa erittäin kustannustehokkaan reitin suuriin tietojoukkoihin [17–20]. Ja mikä tärkeintä, se tarjoaa laatutietoja useiden tutkimusten mukaan, joissa MTurk -näytteitä verrattiin perinteisempiin laboratorionäytteisiin, joissa kokeellinen valvonta on tyypillisesti vahvempaa kuin MTurkilla [16, 19–21].

Kaikilta osallistujilta saatiin tietoinen suostumus verkossa (ennen kuin he lopulta päättivät osallistua osallistujille kerrottiin seuraavaa: "Hyväksymällä tämän HIT: n annat meille tietoisen suostumuksen siihen, että voimme käyttää vastauksiasi nimettömässä muodossa vain tutkimustarkoituksiin.").

Kun osallistujat olivat hyväksyneet HIT: n, he lukivat seuraavan johdantokappaleen: "Tässä HIT: ssä pyydämme teitä vastaamaan ihmissuhteiden luonnetta koskevaan kyselyyn. Kiinnostuksemme on täysin tieteellinen. Kaikki vastaukset käsitellään luottamuksellisesti ja niitä käsitellään vain raportoitu yhteenlasketussa tilastollisessa muodossa. Tässä kyselyssä ei ole oikeita tai vääriä vastauksia. Olemme kiinnostuneita vain rehellisestä arvioinnistasi. Jos tunnet olosi epämukavaksi vastaamalla joihinkin kysymyksiin, sinulla on mahdollisuus valita vastaus "älä halua vastata". "

Yhteensä 772 henkilöä, jotka kaikki rekrytoitiin MTurkista ja Yhdysvaltojen asukkaista, osallistuivat kolmeen tutkimukseemme. Tutkimukset tehtiin helmikuun ja heinäkuun 2014 välisenä aikana. Osallistujiemme keski -ikä oli 34 vuotta (s.d. 11) ja noin 46% oli naisia. Sitä vastoin vertailututkimuksemme osallistujat olivat opiskelijoita, joiden keski -ikä oli noin 19 vuotta. Kolmen tutkimuksen aikana naisten osuus vaihteli 52%: sta 78%: iin. Osallistumispäätöksen jälkeen kohteet ohjattiin kyselykysymyksiin ulkoisella verkkosivulla. Kysely koodattiin Qualtrics -kyselyohjelmistolla (http://www.qualtrics.com/). Kyselykysymykset ovat saatavilla osana tämän asiakirjan tukitietoja (S1 -teksti). Osallistujat saivat osallistumisesta kiinteän maksun (yksityiskohdat on esitetty opintojen kuvauksessa).

Osallistujat esiteltiin ensin tutkimuksen aiheeseen ja heille kerrottiin, että kyse on suhteiden luonteen ymmärtämisestä (katso yllä). Heitä pyydettiin sitten keskittymään yhteen tiettyyn henkilöön (tarkat säännöt vaihtelivat täällä raportoimiemme tutkimusten välillä). Osallistujia pyydettiin tunnistamaan tämä henkilö etunimen alkukirjaimen perusteella. Osallistujille kerrottiin sitten seuraavaa:

"Seuraavassa kuvassa pyydämme sinua harkitsemaan, mikä näistä ympyräparista kuvaa parhaiten suhdettasi [tämän henkilön] kanssa kaikissa seuraavissa kysymyksissä. Kuvassa" X "toimii paikkamerkkinä [tälle henkilölle], eli sinun pitäisi ajatella, että "X" on [tämä yksilö]. Valitsemalla sopivan numeron ilmoita, missä määrin sinä ja [tämä henkilö] olette yhteydessä. "

Näytöllä IOS -tehtävä esitettiin täsmälleen kuten kuvassa 1. Osallistujien oli valittava vastaus yksinkertaisella napsautuksella, mutta he voivat myös ilmoittaa, että he eivät halunneet vastata.

Saimme myös aikaan kaksi muuta kirjallisuudessa ehdotettua toimenpidettä suhteiden läheisyyden mittaamiseksi. Ensinnäkin Cialdini et ai. [22], heti IOS -asteikon saamisen jälkeen lisäsimme "We Scale". Tarkka sanamuoto oli seuraava: "Ole hyvä ja valitse alla oleva numero osoittaaksesi, missä määrin käyttäisit termiä" ME "luonnehtiessasi sinua ja [tätä yksilöä]. Vastaukset olivat 7-pisteisellä asteikolla (1 =" ei ollenkaan "7 =" hyvin paljon "). IOS-asteikon ja" We-Scalen "välinen keskiarvo muodostaa mitta, jota Cialdini ym. [22] kutsuvat" ykseydeksi ".

  1. "Suhteessa kaikkiin muihin suhteisiisi (sekä samaan että vastakkaiseen sukupuoleen) miten luonnehtisit suhdettasi X: ään?"
  2. "Suhteessa siihen, mitä tiedät muiden ihmisten lähisuhteista, miten luonnehtisit suhdettasi X: ään?"

Vastaukset olivat 7-asteikolla, jossa 1 = "ei lähellä" ja 7 = "hyvin lähellä". SCI on yksinkertaisesti pisteiden summa.

IOS -asteikkoa, We -asteikkoa ja SCI -asteikkoa käytetään kaikissa kolmessa tutkimuksessa. Tutkimus 1 vertaa niitä RCI: hen. Raakatiedot ovat saatavana tukitiedostona S1 -tietojoukko (Excel -muodossa).

Päätämme kattavan IOS -asteikon arvioinnin uudella pääkomponenttien analyysillä, jota käytämme "Suhteen läheisyyden indeksin" johtamiseen. Tämä indeksi on kattava vertailukohtamme IOS -asteikolle.


Ketä haastatella

Aloitan tämän osan keskustelulla näytteenotosta. Kun teet kyselyä, on tärkeää valita edustava joukko yksilöitä kankaille. Koko Yhdysvaltojen väestönlaskennan tekeminen on sekä kohtuuttoman kallista että tarpeetonta. Sen sijaan kyselytutkijat valitsevat otoksen kiinnostavasta väestöstä (täällä Yhdysvaltojen asukkaat).

Tekniseltä kannalta oikea tapa ottaa tällainen näyte on yksinkertaisen satunnaisotannan (SRS) avulla. Yksinkertaisilla satunnaisnäytteillä on kaksi tärkeää ominaisuutta: Jokainen yksilö valitaan otokseen sattumanvaraisesti, ja jokaisella populaation jäsenellä on yhtäläinen mahdollisuus päästä otokseen. Näissä olosuhteissa jokaisella mahdollisella tietyn kokoisella näytteellä on samat mahdollisuudet valita. Jokaisella Yhdysvaltojen asukkaalla on siis yhtäläinen mahdollisuus päästä kyselyyn. Mutta tämä teknisesti oikea menettely on käytännössä mahdoton toteuttaa tai ainakin mahdottoman kallis. Siksi tutkijat ovat aina jääneet tämän ihanteen alle. Sen sijaan harjoittajat ovat käyttäneet muita menetelmiä, jotka varmistavat edustavat näytteet.

Suurimman osan 1900-luvusta nämä menettelyt sisälsivät kasvotusten monivaiheiset mallit ja puhelinhaastattelut satunnaisvalinnalla (yleiskatsaus, katso Lohr 2010). Nämä menetelmät, vaikka eivät SRS, voidaan suorittaa tavoilla, joiden avulla tutkijat voivat lähentää SRS: ää. Tilastollisia menetelmiä on kehitetty ottamaan huomioon nykyaikaisen tutkimuksen otannan suunnittelukomponentit, kuten klusterointi ja kerrostuminen (Kish 1965, Lohr 2010).

Lisäksi tutkijat ja ammatinharjoittajat ovat kehittäneet menetelmiä otantaan otoksen ja näytteen keräämisen välisen epätasapainon huomioon ottamiseksi. Kaikki kyselyyn valitut vastaajat eivät suostu haastatteluun.Keskustelen tämän vastaamatta jättämisen vaikutuksista myöhemmin tässä artikkelissa, mutta toistaiseksi on tärkeää, että tutkijat ovat kehittäneet tapoja korjata tämä ongelma. Useimmissa tapauksissa meillä on vain vähän tietoa väestöstä (suhteessa otokseen) Yhdysvaltojen väestönlaskennasta kerättyjen tietojen muodossa. Näissä tapauksissa painotuksen oikaisuja käytetään tyypillisesti vähentämään harhaa, jota vastaus voi aiheuttaa kyselyarvioissa (Lohr 2010). Jos esimerkiksi kyselyn otoksessa on enemmän vanhoja vastaajia kuin väestössä, vanhoille vastaajille annetaan vähemmän painoarvoa ja nuorille vastaajille enemmän, joten mukautetun otoksen ikäjakauma vastaa väestöjakaumaa. Yksi tapa, jota tavallisesti käytetään näytteiden painottamiseen, on haravointi. Haravointi vastaa solumäärää painotusjärjestelmässä käytettyjen muuttujien marginaalijakaumiin. Muut tekniikat, kuten regressiopainotus ja taipumuspisteen painotus, hyödyntävät yksityiskohtaisempia tietoja. Lohr (2010) tarjoaa hyödyllisen yleiskuvan näistä eri painotusmenetelmistä (ks. Myös Lumley 2010).

Pollingin muuttuva maisema

Jos kirjoitan tämän artikkelin 20 vuotta sitten - tai jopa 15 vuotta -, tämä osio päättyy tähän. Otantamenetelmät kasvokkain ja puhelimitse olivat hyvin kehitettyjä, ja kyselytutkijat voisivat olla varmoja siitä, että heidän kyselyihinsä vastanneiden ryhmä edusti riittävästi koko Yhdysvaltain väestöä. Kysymys, ketä haastatella, esitettiin ja siihen vastattiin. Kuitenkin 1990 -luvulta lähtien ja erityisesti vuosisadan vaihteesta lähtien monet tapahtumat ovat saaneet äänestysalueen epäjärjestykseen. Mielipidekyselyiden edustavuus perustuu tutkijoiden kykyyn kommunikoida todellisesti otantamenettelyssään valitsemiensa vastaajien kanssa. Tästä on tullut ajan myötä yhä vaikeampaa. Mahdollisiin vastaajiin on yhä vaikeampi ottaa yhteyttä, ja kun tutkijat voivat ottaa yhteyttä tällaisten henkilöiden osajoukkoon, nämä mahdolliset vastaajat eivät todennäköisesti suostu osallistumaan kyselyihin.

Mielipidekyselyihin vastaamatta jättäminen alkoi kasvaa hälyttävästi 1990 -luvun lopulta lähtien. Sekä yhteydenpito- että yhteistyöasteet laskivat jyrkästi. Paras ylitietojen lähde tähän kysymykseen on Pew Center for the Study of the People and the Press, joka on julkaissut yksityiskohtaisia ​​lukuja kyvystään tavoittaa mahdolliset vastaajat lähes 20 vuoden ajan. Nämä tiedot esitetään Kuvio 1. Vuonna 1997 Pew pystyi ottamaan yhteyttä 90%: iin mahdollisista vastaajistaan, ja 43% näistä henkilöistä suostui vastaamaan kyselyyn, jolloin kokonaisvastausaste oli 36%. Vuoteen 2012 mennessä yhteydenpitoaste laski 62%: iin ja yhteistyöaste 14%: iin, jolloin vastausprosentti oli vain 9%. Nykyään yli yhdeksän kymmenesosaa mahdollisista vastaajista ei pääse otokseen yhdeksi parhaiten hoidetuista kyselytutkimuksista Yhdysvalloissa. Varmasti Pew: tä vähemmän ammattitaitoisten organisaatioiden vastausprosentti on vieläkin alhaisempi. 2

Muut teknologiset muutokset ovat häirinneet myös tutkimusalan tutkimusta. Yhä useammat amerikkalaiset ovat luopuneet lankapuhelimista matkapuhelinten hyväksi. Vuodesta 2003 lähtien Center for Disease Control and Preventionin kansallinen terveyshaastattelututkimus (NHIS) on mitannut vain soluja sisältävien kotitalouksien esiintyvyyttä Yhdysvalloissa. Tänä aikana vain langattoman puhelinpalvelun kotitalouksissa asuvien aikuisten osuus nousi 3 prosentista 48 prosenttiin (Blumberg & amp Luke 2016). Tämä viestintätekniikan muutos merellä on muuttanut perinteiset puhelinäänestykset. Matkapuhelinhaastattelut ovat kalliimpia kuin lankahaastattelut, koska maanmittareilla on laki (vuoden 1991 puhelinkuluttajansuojalaki, 47 U.S.C. 227) kielletty käyttämästä automaattisia soittajia, jotka tekivät puhelinhaastattelusta edullisen. Mutta on olemassa vakavampia ongelmia kuin liiketoiminnan kustannukset. Vaikka varhaiset tutkimukset olivat osoittaneet, että vain solutason kotitalouksiin liittymättä jättämisen aiheuttamia harhoja voitaisiin korjata painottamalla vain lankapuhelin otos, joka heijastaa väestön ominaisuuksia keskeisissä muuttujissa, kuten iässä ja rodussa (Brick et al. 2006, Keeter 2006) , vuoteen 2008 mennessä tämä ratkaisu näytti lakanneen toimimasta. Keeter et ai. (2008) havaitsivat, että lankapuhelinnäytteiden painottaminen väestön tunnettujen ominaisuuksien huomioon ottamiseksi ei voinut ottaa huomioon vain matkapuhelimen omaavien yksilöiden eri äänestysasetuksia. Yksilöt, joilla oli vain matkapuhelimet, olivat pohjimmiltaan erilaisia ​​kuin lankapuhelimia käyttävät henkilöt (ehdolliset väestötieteelliset toimenpiteet, kuten ikä ja rotu, jotka ovat tutkijoiden käytettävissä). Täten lankapuhelinvastaavien todennäköisyysnäytteet poissulkeivat erillisen osan väestöstä otantakehyksestä. Toisin sanoen pelkästään soluja sisältävien henkilöiden mielipiteet edustavat puuttuvia tietoja, joita emme voi helposti korvata. Muiden tieteenalojen tutkijat ovat tulleet samanlaisiin johtopäätöksiin (katso sivupalkki nimeltä Matkapuhelimen kattavuus ja kyselyt).

Sairauksien torjunnan ja ennaltaehkäisyn keskusten (CDC) kansallinen terveystilastokeskus vertasi National Health Interview Survey (NHIS) -tietoja vain lankapuhelimesta otetuista näytteistä "kaksikehyksisten" näytteiden tietoihin, jotka sisälsivät sekä solu- että lankapuhelintaloutta. He havaitsivat, että pelkän lankapuhelimen otoksen painottaminen väestönlaskennan väestötietojen mukaisesti tuotti puolueellisia arvioita väestön ominaisuuksista ja terveyskäyttäytymisestä (Blumberg & amp. Luke 2009). CDC on jopa ilmaissut huolensa suurimmasta käynnissä olevasta puhelinhaastatteluterveystutkimuksestaan, Behavioral Risk Factor Surveillance Systemistä. CDC: n tutkijat suorittivat rinnakkaisen vain solututkimuksen vuonna 2008 ja löysivät suuria eroja monien itse raportoitujen asenteiden ja käyttäytymisten välillä yhdistetyn näytteen ja vain lankapuhelimen otoksen välillä jopa painotuksen jälkeen (Hu et al. 2011).

Tämän seurauksena suuret tiedotusvälineet ja akateemiset organisaatiot ovat siirtyneet haastatteluun sekä lankapuhelimilla että matkapuhelimilla. Toistaiseksi ei kuitenkaan ole laajalti hyväksyttyä matkapuhelinmittauksen "parhaita käytäntöjä" (Lavrakas et al. 2010) eikä yksimielisyyttä siitä, miten matkapuhelin- ja lankapuhelinvastaajat voidaan parhaiten yhdistää yhdeksi otokseksi käyttämällä "kaksikehystä" ”Lähestymistavat (Lavrakas et al. 2010, josta keskustellaan tarkemmin, katso Brick et al. 2006, Kennedy 2007, Guterbock et al. 2011, Levine & amp; Harter 2015). Matkapuhelimet on sidottu yksilöihin, kun taas lankapuhelimet ovat kotitalouksissa. Näytteiden sekoittaminen näiden kahden tyyppisten kosketuspisteiden kanssa ei ole helppoa. Esimerkiksi monet ihmiset ovat tavoitettavissa sekä matkapuhelimella että lankapuhelimella. Molemmissa kehyksissä esiintyvillä henkilöillä on suurempi todennäköisyys osallistua.

Ehkä ajan myötä matkapuhelimien levinneisyys on riittävän laaja vastaamaan lankapuhelimien kattavuutta 1990-luvun alussa. Kuitenkin siihen päivään asti tie eteenpäin on epäselvä. Matkapuhelinten nousu uhkaa selvästi kyselyiden edustavuutta, mutta tähän ongelmaan ei ole ilmeisiä korjaustoimenpiteitä.

On erittäin vaikeaa määritellä kohderyhmä, jota haluaisimme edustaa otoksellamme. Hillygus (2016) huomauttaa aivan oikein, että ei ole olemassa luetteloa kaikista Internetin käyttäjistä, joihin voimme vedota puhelinnumeroiden luetteloa vastaavasti. Tämän seurauksena Internetin kautta tehtävää tutkimusta tehdään usein epätodennäköisyysnäytteillä (vaikka tietenkin, kuten muut kuin online-kyselyt eivät ole luontaisesti todennäköisyysnäytteitä, online-kyselyjen ei välttämättä tarvitse olla epäolennaisnäytteitä). Jotkut yritykset esimerkiksi ottavat näytteitä vapaaehtoisten verkkopaneeleista. Nämä näytteet mukautetaan sitten väestön arvioimiseksi eri tavoilla, mukaan lukien kiintiönäyte väestönlaskennan väestötietojen vastaamiseksi, mallipohjainen taipumus vastaavuuteen ja jälkitutkimuksen säätö jollakin painotustekniikalla (Baker et al. 2010). Keskeinen asia on kuitenkin se, että riippumatta siitä, mitä mekanismia käytetään, näitä Internet -paneelien näytteitä ei voida pitää samankaltaisina kuin satunnaisnäytteitä. American Association for Public Opinion Research (AAPOR) -työryhmä - johtava kyselytutkimuksen tutkijoiden ja harjoittajien järjestö - totesi, että "tällä hetkellä ei ole yleisesti hyväksyttyä teoreettista perustetta, jonka perusteella voidaan väittää, että tutkimustulokset, joissa käytetään näytteitä ei -todennäköisyyteen liittyvistä verkkopaneeleista, ovat suurelle yleisölle ”(Baker et al. 2010, s. 758). Huolimatta lupaavasta työstä tällä alalla (Gelman ym. 2016), AAPOR -raportin julkaisemisesta kuluneiden kuuden vuoden aikana tästä asiasta ei ole päästy yksimielisyyteen. 3

Mitä tulevaisuus tuo tullessaan?

Vaikka tie eteenpäin on epäselvä, kyselyt eivät mene minnekään, ne ovat edelleen poliittisen järjestelmän kriittinen osa. Päättäessään kyselynsä tutkimuskyselyn historiasta Yleinen mielipide neljännesvuosittainSeitsemänkymmenenviidennen vuosipäivän numerossa Robert Groves (2011, s. 870) toteaa oikein: ”Kyselytutkimus ei kuole, se muuttuu.” Kun teollisuus kamppailee selvittääkseen, kuinka kerätä näytteitä vastaajista nykymaailmassa, jotkut perustiedot on tunnistettava ja harkittava huolellisesti, kun määritetään, kuinka parhaiten rakentaa otos ihmisten tahdon arvioimiseksi. Seuraava ehdotussarja tarjoaa toivottavasti tuottavan lähtökohdan ajatella, miten parhaiten voidaan ottaa näytteenottoa täsmällisesti.

Ensinnäkin voi olla hyödyllistä ajatella kyselyitä tällä hetkellä vaivaavia puuttuvia tietoja koskeviksi ongelmiksi. Keskeinen haaste haastateltavien valitsemisessa on minimoida erot kysymyksiemme ja kaipaamiemme ihmisten välillä. Esimerkiksi perusongelma lankapuhelimien käytön jatkamisessa otantatutkimuksen vastaajiin on, että valtaosa ihmisistä, joiden pitäisi kuulua otokseen, ei ole otoksessamme - joko siksi, että emme voi tavoittaa heitä tai koska he kieltäytyvät vastaamasta kysymyksiimme, kun ota heihin yhteyttä. Tästä näkökulmasta oikea tapa korjata ongelma on pohtia, kuinka tavoittamamme ihmiset eroavat ihmisistä, joita emme voi tavoittaa - ja ottaa nämä erot huomioon painotuksen avulla. Voimme mukauttaa otoksiamme, mutta saadaksemme tarkan kuvan julkisesta tahdosta meidän on mitattava tiettyjen kyselyiden vastaajien ja vastaamattomien erot. Jos emme tee niin, arviomme yleisön tahdosta on väärä-kuten se, että painotus ei korjaa pelkästään solua koskevaa harhaa vuoden 2004 jälkeen, osoittaa. Tämä huolenaihe on erityisen tärkeä, koska painotukseen käytetyt apumuuttujat valitaan usein mielivaltaisesti niiden saatavuuden perusteella sekä tutkimuksissa että tietojoukkoissa, jotka mittaavat väestön ominaisuuksia - kuten ikää ja sukupuolta - riippumatta siitä, vähentävätkö ne todellisuudessa arvioidemme harha. Se, että Yhdysvalloilla on suhteellisen harva kokoelma julkisesti saatavilla olevia väestötason väestötietoja (Massey & amp Tourangeau 2013), osoittaa, että painotusongelma ei poistu lähiaikoina.

Toiseksi todennäköisyys- ja epätodennäköisyysnäytteet ovat pohjimmiltaan erilaisia, ja vastausten keräämismenetelmiä verrattaessa on otettava huomioon useita tekijöitä. On tärkeää tunnistaa nämä erot edelleen, myös aikakaudella, jolloin todennäköisyysvaste romahtaa pieniin yksittäisiin numeroihin. Kuten Brick (2011, s. 876) toteaa, "[A] yleinen pidätys on, että todennäköisyysnäyte, jolla on alhainen vastausprosentti tai kattavuus, ei ole" parempi "kuin ei -todennäköinen tai vapaaehtoinen otos." Mutta tämä näkökulma ei ehkä ole tarkka. Se, että kyselyllä on alhainen vastausprosentti - jopa häviävän alhainen vastausprosentti - ei tarkoita, että se olisi pohjimmiltaan virheellinen. Itse asiassa se voi olla parempi kuin epätodennäköisyysnäyte, joka näyttää enemmän populaatiolta määrien perusteella, joita voimme mitata. Todennäköisyysnäytteet on rakennettu vahvalle päättelypohjalle, koska riippumatta siitä, kuinka alhainen vastausprosentti on, kaikki otokseen valitut yksiköt rekrytoidaan aktiivisesti ja heitä kannustetaan osallistumaan kyselyyn. Tämä ei pidä paikkaan, joka ei ole todennäköinen. Toisin sanoen, on ero sen välillä, että tulen luoksesi tutkijana ja pyydän sinua osallistumaan kyselyyn ja sinä tulet luokseni vastaajana ja pyydät minua olemaan osa tutkimustani. Se, että verkkopaneelit voivat sisältää ”ammattimaisia” vastaajia, jotka haluavat tehdä useita kyselyitä rahan ja muiden kannustimien vuoksi (Hillygus et al. 2014), korostaa tätä ongelmaa. Ellemme pysty mittaamaan tarkasti eroja, jotka johtavat itsevalintakäyttäytymiseen epätodennäköisyysnäytteissä, emme voi ottaa huomioon näitä eroja. Tästä huolimatta laskevat vastausprosentit ovat selvästi huolestuttavia, ja todennäköisyys- ja ei -todennäköisyysnäytteenottojen suhteellisista eduista olisi keskusteltava jatkuvasti - mutta sen on oltava keskustelu, joka perustuu sekä perinteisten näytteenottomuodon että uudempien otantamuotojen rajoituksiin.

Lopuksi meidän on harkittava tarkasti kysymystä, ketä haastatella - emmekä saa lakata ajattelemasta sitä vain siksi, että olemme löytäneet sen, mitä pidämme hyväksyttävänä ratkaisuna nykyään. Se, mikä on totta tänään, ei ehkä ole totta huomenna, ja on aina tärkeää olla valppaana otantamenetelmien arvioinnissa. Vuoden 1936 Literary Digest -katkon opetukset ovat havainnollistavia tässä. Siinä tapauksessa sähköpostin palautusmenetelmä, joka oli tarkasti ennustanut jokaisen presidentinvaalin vuosina 1920–1932, epäonnistui yhtäkkiä ja näyttävästi (katso lisätietoja Squire 1988). On epäselvää, joudummeko samaan tilanteeseen tänään. Esimerkiksi Yhdistyneen kuningaskunnan vuoden 2015 vaaleihin johtaneet äänestykset ennustivat kuolleen lämpöä konservatiivipuolueen ja työväenpuolueen välillä. Lopulta konservatiivit kuitenkin ohjasivat työväen yli kuusi prosenttiyksikköä. Britannian vaalitutkimus, joka tehtiin heti vaalien jälkeen ja käytti satunnaista otosta, arvioi äänestystuloksen oikein, minkä vuoksi jotkut epäilivät, että epäonnistunut ennuste johtui virheistä, jotka johtuivat useimpien vaalikyselyiden käyttämistä satunnaisista aihealueista (Clark 2015). Samankaltaiset kokemukset muissa laajamittaisissa ja erittäin tärkeissä vaaleissa johtavat lisäkysymyksiin tiettyjen äänestysmenetelmien hyödyllisyydestä.


Arvon kompromissien mittaaminen: ongelmia ja joitain ratkaisuja

Arvojen kompromissien mittaus on keskeinen sovelletussa päätösanalyysissä. Se oli myös Jane Beattien suuri huolenaihe opinnäytetyöstään lähtien työhönsä Graham Loomesin ja muiden kanssa, jotka on kuvattu viimeisessä luvussa. Osana väitöskirjaansa Jane tutki kahden määritteen ärsykkeiden kokonaisvaltaisten arviointien käyttämistä keinona mitata näiden kahden ominaisuuden välistä kompromissia (Beattie & amp; Baron, 1991).

Eräs mahdollinen vaikeuden vaikutus on tehdä kompromisseja koskevista tuomioista epävakaampia ja vaikuttaa enemmän vieraisiin tekijöihin. Eräänlainen kompromissiratkaisu on tehdä ärsykkeiden kokonaisvaltaisia ​​toivottavuusluokituksia ärsykkeiden joukossa, jotka vaihtelevat vähintään kahdessa ulottuvuudessa, esimerkiksi ostokustannukset ja matka -aika sen ostamiseksi. Kahden ulottuvuuden välisiä kompromisseja voidaan arvioida kysymällä, kuinka paljon yhdestä ulottuvuudesta on luovuttava, jotta voidaan korvata toisen ulottuvuuden muutos suhteessa näiden muutosten vaikutukseen luokitukseen. Tämän kompromissimittauksen tulisi heijastaa näiden muutosten vaikutusta tavoitteisiin, jotka johtavat tuomioihin, esim. Halukkuuteen uhrata aikaa säästääkseen rahaa. Kummankaan ulottuvuuden arvoalue ei saisi vaikuttaa siihen.

Havaitsimme yleensä, että vaihteluväli ei itse asiassa vaikuta kompromisseihin edellyttäen, että vaihteluväli ei välittänyt mitään hyödyllistä tietoa. Jos tämä tulos on yleensä totta, kokonaisvaltaiset tuomiot olisivat hyvä tapa mitata kompromisseja käytännön tarkoituksiin. Mellers ja Cooke (1994) löysivät kuitenkin erilaisia ​​vaikutuksia useissa vastaavissa tehtävissä.

Tämä tutkimus havaitsee epäjohdonmukaisen herkkyysmallin itseään kohtaan. Se on kuitenkin myös havainnut arvojen suuruusvaikutuksia, jotka voivat olla riippumattomia vaihtelualueesta koeryhmässä. Esimerkiksi rahan määrä, joka on säästettävä ylimääräisen tunnin käyttämisen perustelemiseksi, on suurempi, kun ostohinta on korkeampi, ikään kuin rahan hyödyllisyys arvioitiin osuutena hinnasta eikä absoluuttisena summana. Jotkut etäisyysvaikutukset voivat johtua suuruusvaikutuksista, mutta emme silti ymmärrä olosuhteita, jotka tuottavat aluevaikutuksia, kun suuruus pidetään vakiona.

Johdanto

Arvojen kompromissien mittaus on keskeinen sovelletussa päätösanalyysissä. Kuinka paljon rahaa elämä on? Terveyden vuosi? Tunnin helpotus kivusta? Miten meidän pitäisi valita hoidon oireet valitessaan syövän hoitoa paranemisen todennäköisyyttä vastaan? Miten meidän pitäisi ostaa auto ostaessamme auton turvallisuus kuljettajalle sen vaikutuksia ilmansaasteisiin? Jos voisimme vastata näihin kysymyksiin keskimäärin, voisimme suunnitella käytännöt, jotka on suunniteltu maksimoimaan hyödyllisyys. Esimerkiksi terveydenhuollon tarjoaja voisi tarjota kaikki hengenpelastavat hoidot siihen pisteeseen asti, jolloin keskimääräiset kustannukset elinvuotta kohden ovat enemmän kuin sen asiakkaat tai kansalaiset keskimäärin ajattelevat maksettavan. Samaa voidaan sanoa muista julkisista menoista moottoritien turvallisuudesta erämaiden suojeluun.

Tämän lähestymistavan ongelma on se, että vastaukset ovat usein sisäisesti epäjohdonmukaisia ​​(Baron, 1997a). Osa epäjohdonmukaisuuksista on ominaista käytetyille menetelmille. Esimerkiksi hypoteettisten uhkapelien käyttöä näyttää vääristävän varmuusvaikutus ja yleisemmin se, että todennäköisyyksiä, jotka ovat suurempia kuin nolla ja pienempi kuin yksi, näytetään kohdeltavan samankaltaisemmilta kuin niiden pitäisi olla.

Muut epäjohdonmukaisuuden lähteet ovat yleisempiä. Ensisijaisesti ihmiset eivät ole herkkiä määrälle, kun he vertaavat kahta ominaisuutta. Ihmisten on yllättävän helppo sanoa, että terveys on tärkeämpää kuin raha, kiinnittämättä paljon huomiota kyseiseen terveyteen tai rahamäärään. Esimerkiksi Jones-Lee, Loomes ja Philips (1995) pyysivät vastaajia arvioimaan hypoteettisia auton turvalaitteita, jotka vähentäisivät liikennevammojen riskiä. Vastaajat ilmoittivat olevansa valmiita maksamaan (WTP) laitteista. WTP -tuomiot olivat keskimäärin vain 20% korkeammat, kun riski pieneni 12: lla 100 000: sta kuin 4: llä 100 000: sta. Tällaiset tulokset viittaavat siihen, että rahan ja tavaran välinen korvausaste, dollaria yksikköä kohden, riippuu vahvasti tavaran määrästä. Jos 12: n riskinvähennys on 120 dollarin arvoinen ja 4: n riskinvähennys 100 dollarin arvoinen, dollari riskinvähennysyksikköä kohti on 10 ja 25 vastaavasti. Jos ekstrapoloimme alaspäin lineaarisesti, 0: n riskinvähennys olisi 90 dollarin arvoinen. Tai voimme ajatella, että asteikko on logaritminen, joten 1/3 riskinvähennyksestä olisi 5/6 hinnan arvoinen. Joten riskinvähennys 4 · 1 /3· 1 /3, tai .44, olisi 100 dollarin arvoinen ja#183 5 /6 · 5 /6 tai 69,44 dollaria tai noin 156 dollaria riskinvähennysyksikköä kohden.Dollari yksikköä kohti voi nousta ilman rajoituksia. Emme voi kertoa virheen koosta luottamusvälillä - edes logaritmisella asteikolla - koska luottamusväli on mahdollisesti rajaton. Tämä vaikeuttaa tulosten yleistämistä eri rahasummille tai riskeille, mikä on lähes aina tarpeen. Vaikka tällaista yleistämistä ei tarvita, tällainen äärimmäinen epäherkkyys pienillä alueilla herättää kysymyksiä minkä tahansa yksittäisen arvion pätevyydestä.

Ongelma ei rajoitu WTP: hen. Näin tapahtuu, kun vastaajia pyydetään määrittämään suhteelliset painot suoraan ei-rahallisille määritteille. Tyypillisesti attribuutit annetaan selkeillä alueilla, kuten '' ero $ 10 ja $ 20 maksamisen välillä '' ja '' ero riskin välillä 1/10 000 ja riskin välillä 2/10 000. '' tyypillisesti aliherkkä määritteiden alueelle. Jos riskin katsotaan olevan kaksi kertaa niin tärkeä kuin kustannukset, tämä arviointi ei vaikuta suhteellisesti, kun riskinvähennys kaksinkertaistetaan (Weber & amp; Borcherding, 1993). Keeney (1992, s. 147) kutsuu tällaista aliherkkyyttä vaihteluvälille `` yleisimmäksi kriittiseksi virheeksi ''.

Kolmas arviointityyppi kärsii samasta ongelmasta, kahden välin suhteellisen hyödyllisyyden arviointi. Terveystilanteissa vastaajia pyydetään usein arvioimaan jokin sairaus, kuten yhden silmän sokeus, asteikolla, joka on ankkuroitu normaaliin terveyteen ja kuolemaan. Epäsuorasti heitä pyydetään vertaamaan kahta aikaväliä: normaali-sokea silmässä ja normaali-kuolema. Mitä tapahtuu, kun muutamme standardia, toista aikaväliä? Normaalisti tuomion pitäisi muuttua suhteessa. Esimerkiksi pitämällä normaali jokaisen ulottuvuuden toisessa päässä, sokean silmässä hyödyllisyyden suhteessa kuolemaan pitäisi olla kahden muun mittasuhteen tulos: sokean silmässä hyödyllisyys suhteessa sokeuteen (molemmissa silmät) ja sokeuden hyöty suhteessa kuolemaan. Itse asiassa ihmiset eivät sopeudu riittävästi standardin muutoksiin (Ubel et ai., 1996), aivan kuten he eivät sopeudu riittävästi muutoksiin muiden ulottuvuuksien laajuudessa, jotka liittyvät muihin kompromissituloksiin. Kutsun tätä ilmiötä `` suhde epäjohdonmukaisuudeksi '', koska se perustuu suhteiden tuloon (Baron et al., 1999). Näen myös nämä erilaiset herkkyyden muodot saman ongelman ilmentyminä. Periaatteessa kaikki tunnetut herkkyyden ilmentymät voitaisiin ymmärtää taipumuksina antaa sama vastaus kysymyksestä riippumatta. On avoin kysymys, voidaanko epäjohdonmukaisuuden eri muodot selittää samalla tavalla vai ei.

Aliarvostusta kantamaan voidaan vähentää. Fischer (1995) havaitsi täydellisen aliherkkyyden vaihteluvälille, kun vastaajia pyydettiin yksinkertaisesti määrittämään painot alueille (esim. Ero 25 000 ja 35 000 dollarin aloituspalkan ja 5–25 lomapäivän - tai 10–20 lomapäivän - välillä työ). Kun lomapäivien määrä kaksinkertaistui, koko päivän (10 vs. 20) arvioitu merkitys suhteessa palkka -alueeseen (10 000 dollaria) ei kasvanut. Näin ollen vastaajat osoittivat epäjohdonmukaisia ​​korvausasteita tarkastelualueesta riippuen. Vastaajat olivat herkempiä vaihteluvälille, ja niiden painot lähestyivät vaadittua kaksinkertaistumista ja kaksinkertaistivat alueen, kun he käyttivät joko suoria kompromisseja tai kääntöpainoja. Suorassa kompromississa vastaaja muutti yhden arvon tärkeämmästä ulottuvuudesta siten, että nämä kaksi ulottuvuutta olivat yhtä tärkeitä, esimerkiksi alentamalla palkkaulottuvuuden ylintä palkkaa. (Painot on pääteltävä joko mittaamalla tai olettaen hyötyfunktio kullekin ulottuvuudelle.) Swing -painomenetelmässä vastaajat arvioivat vähemmän tärkeiden ja tärkeämpien alueiden suhdetta, esim. `` 5 ja 25 lomapäivän välinen ero on 1/5 25 000 ja 35 000 dollarin välisestä erosta. ''

Suorassa kompromissimenetelmässä alue annetaan vain yhdelle ulottuvuudelle. Tehtävä on siis analoginen vapaavalintaisen CV -tuomion kanssa, joten voimme silti odottaa - ja Fischer löysi edelleen - jonkin verran epäherkkyyttä. Baron ja Greene (1996) havaitsivat, että tätä epäherkkyyttä voitaisiin vähentää entisestään antamatta mitään erityisiä alueita jompikumpi ulottuvuus. Vastaajia pyydettiin esittämään kaksi aikaväliä, yksi yhdessä ulottuvuudessa ja toinen, jotka olivat yhtä suuria hyödyllisyydeltään. Esimerkiksi sen sijaan, että kysyisit `` Kuinka paljon olisit valmis maksamaan korotetusta verotuksesta vuosittain estääksesi 10%: n vähennyksen maa-alueiden hankinnassa kansallispuistoille? '', Kahden välin edellytys pyysi tutkittavia antamaan verot ja prosentuaalinen alennus, jota he vastaavat. Tietenkin jokaisen jakson toinen pää oli nolla.

Kokonaisarvosanat

Toinen tapa mitata kompromisseja on pyytää ärsykkeiden luokituksia, jotka vaihtelevat kahdessa tai useammassa ulottuvuudessa. Ärsykkeet voivat olla esimerkiksi politiikkoja, jotka eroavat toisistaan ​​kustannuksissa ja pienentyneessä riskissä. Jos vastaaja tuottaa tarpeeksi näitä tuomioita, voisimme sovittaa hänen vastauksiinsa yksinkertaisia ​​malleja ja päätellä, kuinka paljon yhden ulottuvuuden muutosta tarvitaan toisen ulottuvuuden muutoksen korvaamiseksi, jotta molemmat muutokset yhdessä antaisivat saman arvosanan. Luokitusvasteen ei tarvitse olla lineaarinen funktio yleisestä hyödyllisyydestä (mutta voisimme olettaa, että se oli ensimmäistä arviointia varten). Suuri valikoima menetelmiä käyttää tätä yleistä lähestymistapaa. Kaksi yleisintä termiä ovat toiminnallinen mittaus (esim. Anderson & amp; Zalaski, 1988) ja yhteinen analyysi (Green & amp Wind, 1973 Green & amp; Srinivasan, 1990 Louviere, 1988).

Tällaisessa menetelmässä vastaajalle annetut numerot kussakin ulottuvuudessa edustavat vastaajan arvostamia ominaisuuksia, kuten minuutteja tai dollareita. Näiden ominaisuuksien arvo ei oletuksena ole riippuvainen muista käytettävissä olevista asioista. Näin ollen kummankin ulottuvuuden vaihteluväli ei saisi vaikuttaa kompromissiin tietyn yhden ulottuvuuden muutoksen ja toisen muutoksen välillä toisessa kokeellisessa istunnossa. Jos muutos 50 minuutista 100 minuuttiin kannattaa muuttaa 20 dollarista 40 dollariin, tämän pitäisi olla totta riippumatta siitä, onko dollarin vaihteluväli 20–40 dollaria vai 2–400 dollaria. Epävarmuuden tarve ajan ja rahan korvaamisessa johtuu itse hyödyllisyyden perusideasta, nimittäin siitä, että kyse on tavoitteiden saavuttamisesta (Baron, 1994). Se, missä määrin tavoitteet saavutetaan, riippuu siitä, mitä tapahtuu, ei siitä, mitä vaihtoehtoja harkittiin.

On kuitenkin huomattava kaksi poikkeusta. Ensinnäkin joskus harkitut vaihtoehdot vaikuttavat lopputulokseen niiden vaikutusten kautta tunteisiin. 80 dollarin voittaminen voi tuntua paremmalta, jos se on ensimmäinen palkinto, kuin jos 160 dollaria on ensimmäinen palkinto, koska pettymys ei ole voittanut ensimmäistä palkintoa. Toiseksi, joissakin tapauksissa merkitys kuvauksen tavoitteiden saavuttamisen kannalta riippuu alueesta. Esimerkiksi tutkimuksen raakapisteillä voi olla erilainen vaikutus tavoitteiden saavuttamiseen, koska pistealue vaihtelee, jos tutkimus arvioidaan käyrällä. Vaikka tämä ei pidä paikkaansa, vastaajat, jotka tietävät vähän määrällisestä muuttujasta, saattavat ajatella sitä tällä tavalla, koska he eivät voi arvioida numeroiden merkitystä (esim. 1996).

Beattie ja Baron (1991) käyttivät tällaista kokonaisvaltaista luokittelutehtävää, mutta eivät löytäneet suhteellisten vaihteluvälien vaikutuksia korvausasteisiin useilla ulottuvuuspareilla, mutta löysimme aluevaikutuksia joillakin ulottuvuuksilla, erityisesti niillä, joiden numeerinen esitys ei ollut selvästi yhteydessä perustavoitteisiin, esimerkiksi tentin numeerisiin arvosanoihin. (Tentiarvojen merkitys riippuu vaihtelusta.) Tämä antoi meille toivoa, että kokonaisarvioinnit voisivat antaa johdonmukaisia ​​ja merkityksellisiä arvioita kompromisseista. Lynch et ai. (1991) eivät myöskään löytäneet enimmäkseen mitään vaihteluvälivaikutuksia hypoteettisiin autonostoihin, paitsi yhdessä tutkimuksessa aloittelevien kuluttajien kanssa. (He käyttivät kuitenkin korrelaatioita sijaan korvausnopeuksia, joten on vaikea sanoa, kuinka paljon niiden tulokset johtuivat varianssin muutoksista.) Mellers ja Cooke (1994) löysivät kuitenkin erilaisia ​​vaikutuksia tehtävissä, joissa lukujen suhde perustavoitteisiin nähden, esim. etäisyys asuntojen kampukselle.

Tässä raportoimat kokeet saavat minut pessimistisemmäksi kokonaisvaltaisista luokituksista. Vaikka en voi täysin selittää ristiriitaisia ​​tuloksia, olen pystynyt osoittamaan, että kokonaisvaltaisiin luokituksiin liittyy yleensä toinen vaikutus, joka voi olla yhtä vakava, erityisesti suuruusvaikutus. Ihmiset arvioivat muutoksen tai eron hyödyllisyyden suhteessa potentiaalin kokonaismäärään, vaikka muutos yksin liittyy läheisemmin tavoitteeseen (Baron, 1997a). Tuloksena on, että arvioinnit riippuvat kunkin attribuutin asteikon suurimmasta suuruudesta. Klassinen esimerkki on Tverskyn ja Kahnemanin takkilaskijaongelma (1981, jossa Darke & amp; Freedman, 1993) toisti tietyissä olosuhteissa.

Suurin osa kysytyistä oli valmis tekemään matkan säästääkseen 5 dollaria. Hyvin harvat koehenkilöt olivat halukkaita tekemään matkan säästääkseen 5 dollaria takista, muuten muuten samanlaisessa ongelmassa. Molemmissa tapauksissa `` todellinen '' kysymys on, olisitko valmis ajamaan 20 minuuttia 5 dollarilla. Ihmiset arvioivat 5 dollarin säästämisen hyödyllisyyden suhteessa kokonaissummaan eikä sen vaikutusten perusteella muihin tavoitteisiin, toisin sanoen vaihtoehtoisiin kustannuksiin. Baron (1997b) havaitsi samanlaisen vaikutuksen: koehenkilöt olivat vähemmän halukkaita maksamaan valtion sairausvakuutuksesta sairauksille, kun parantumattomien ihmisten määrä oli suurempi pitäen ennallaan parannettavat. Kun monia ihmisiä ei parannettu, muutamien parantaminen vaikutti `` pudotukseen ämpäriin '' ja oli siten aliarvostettu.

Yleensä suuruus- ja kantavaikutukset sekoittuvat. Suuruus määritellään maksimin ja nollan välisenä erona, ja alue määritellään maksimin ja minimin välisenä erotuksena. Yleensä kokeilijat, jotka vaihtavat vaihteluväliä, manipuloivat myös maksimin. Itse asiassa sekä Beattiella ja Baronilla (1991) että Mellersillä ja Cookella (1993) oli kussakin määritteessä maksimiarvot suurempia aina, kun alue oli korkeampi. Ilmeisesti suuruusvaikutuksia ei aina tapahdu. Tosin niiden esiintyminen tekee toimenpiteestä epäluotettavan. Tarkoitus on, että ne tapahtuisivat, jos suuruusluokka muuttuisi tarpeeksi, joten aiheiden tekemä kompromissi on ominainen niille annettujen mittojen suuruuksille.

Baron (1997b) ehdottaa, että suuruusvaikutus on osa perustavaa laatua olevaa sekaannusta samanlaisten (ja usein korreloivien) määrällisten mittausten välillä. Aivan kuten pienet lapset vastaavat numeroita koskeviin kysymyksiin ikään kuin ne liittyisivät pituuteen (korreloiva ominaisuus) ja päinvastoin, niin aikuiset vastaavat eroja koskeviin kysymyksiin ikään kuin suhteista ja päinvastoin. Erot ja suhteet korreloivat. Näin ollen keskusteltaessa lääkkeiden vaikutuksista riskiin ihmiset puhuvat suhteellisesta riskistä (esim. Rintasyöpätapausten suhde lääkkeeseen ja tapauksiin, joissa sitä ei ole) eikä riskin muutoksesta (syövän todennäköisyyden ero ja syövän todennäköisyyden ero ilman). Viimeksi mainittu on tärkeämpää päätöksenteossa.

Sekä puhtaan alueen vaikutukset että suuruusvaikutukset voivat johtua a: n käytöstä suhteellisuus heuristinen. Joku, joka käyttää tätä heuristiikkaa, arvioi yhden ominaisuuden muutoksen suhteena johonkin muuhun, vaikka se olisi arvioitava yksinään. Tämä on kohtuullinen heuristiikka, kun emme tiedä mitään attribuutin merkityksestä. Esimerkiksi kun arvioimme 30 pisteen ja 40 pisteen välisen eron välitestissä, tämän eron merkitys voi hyvinkin riippua siitä, onko pistealue 20-50 vai 0-60.

Yleiskatsaus

Tämän luvun loppuosassa kuvailen kahta kokeilua. Ensimmäinen sarja osoittaa suuruusvaikutusten olemassaolon kokonaisvaltaisissa luokituksissa ja kuvaa joitain niiden esiintymisen rajoja. Tulokset vahingoittavat ajatusta käyttää kokonaisvaltaisia ​​luokituksia kompromissien mittaamiseen.

Kahdessa viimeisessä kokeessa tutkin erilaista lähestymistapaa ja jatkan siitä, mihin Loomes jäi lukemasta. Ehkä voimme mitata arvokkaita kompromisseja työskentelemällä vastaajien kanssa, kohdata heidät tuomioidensa epäjohdonmukaisuuksiin ja pyytää heitä ratkaisemaan nämä epäjohdonmukaisuudet. Päätösanalyytikot väittävät, että johdonmukaisuustarkastukset eivät yleensä loukkaa vastaajan parasta harkintaa, esimerkiksi: ``. jos johdonmukaisuustarkastuksissa ilmenee ristiriitoja päätöksentekijän ilmoittamien aiempien mieltymysten kanssa, nämä erot on kiinnitettävä hänen tietoonsa ja osa arviointimenettelystä on toistettava, jotta saadaan yhdenmukaiset mieltymykset. . Tietenkin, jos vastaajalla on vahvat, terävät, muuttamattomat näkemykset kaikista kysymyksistä ja jos ne ovat epäjohdonmukaisia, olisimme sekaisin, eikö niin? Käytännössä vastaaja kuitenkin tuntee yleensä olevansa epätarkempi joistakin vastauksistaan ​​kuin toiset, ja juuri tämä epätarkkuuden aste tekee yleensä eron. Sillä silloin on yleensä mahdollista luoda lopullinen johdonmukainen vastausjoukko, joka ei ole väkivaltaisesti ristiriidassa voimakkaiden tunteiden kanssa '' (Keeney & amp; Raiffa, 1993, s. 271). Tällaiset tarkastukset voivat jopa parantaa numeeristen arvioiden pätevyyttä (esim. Keeney & amp; Raiffa, 1993, s. 200).

Baron et ai. (1999) löysi todisteita näiden väitteiden tueksi tutkimuksissa, jotka koskivat terveysalan palveluiden saamista. Yllä kuvatut suhdeherkkyyden yhdenmukaisuustarkastukset eivät johtaneet aiheisiin vakavia vastalauseita. Lisäksi erilaiset hyödyllisyystoimenpiteet sopivat todennäköisemmin, kun kutakin toimenpidettä aiheen mukaan muutettiin, jotta se olisi johdonmukainen.

Koe 1

Koe 1 perustuu takkilaskimen ongelmaan. Koehenkilöt tekivät kolme tehtävää:
Arvosana: Koehenkilöt arvioivat houkuttelevuuden vuoksi ostot, jotka eroavat hinnasta ja ajasta.
WTP: Koehenkilöt ilmaisivat halukkuutensa maksaa (WTP) rahaa säästääkseen aikaa tai rahaa.
Erilaiset arvostelut: Koehenkilöt vertasivat aikaväliä (esim. `` 30 minuutin ja 1 tunnin välinen ero '') ja hintaväliä (esim. `` 90 dollarin ja 100 dollarin välinen ero ''). He ilmoittivat, mikä oli heille tärkeämpää, ja välien suhteelliset koot suhteessa asiaan.

Suuruus ja kantama vaihtelivat hieman itsenäisesti. Suuruusluokkaa manipuloitiin kertomalla hinta 4: llä. Arviointitehtävässä vaihteltiin vaihteluvälillä vaihtamalla kaksi ensimmäistä kohtaa kussakin 8 hengen ryhmässä.

Menetelmä

53 tutkittavaa - 38% miehiä, 92% opiskelijoita, ikä 17-52 (mediaani 19) - täytti kyselyn Internetissä. Aiheita pyydettiin julkaisemalla uutisryhmiä ja linkkejä eri verkkosivuilta. Heille maksettiin 4 dollaria, ja heidän täytyi antaa osoite ja sosiaaliturvatunnus voidakseen maksaa.

Kyselyssä oli kaksi tilausta. Järjestys ei vaikuttanut tulokseen. Kyselylomakkeessa oli neljä osaa, Ratings, WTP, Difference Judgments ja Ratings.

Arviointitehtävä alkoi: `` Kuvittele, että ostat kannettavan CD-soittimen ja olet päätynyt brändiin, joka on listattu 120 dollarilla. Sitä on saatavana useista kaupoista, jotka eroavat matka -ajalta asuinpaikastasi (edestakainen matka), myyntihinnasta ja takuuehdoista. Arvioi seuraavat houkuttelevuuden vaihtoehdot asteikolla 1 - 9, jossa 1 tarkoittaa, että et todennäköisesti valitse tätä vaihtoehtoa ja 9 tarkoittaa, että valitset sen erittäin todennäköisesti. Yritä käyttää koko asteikkoa. Kaksi ensimmäistä tuotetta ovat pahimpia ja parhaita. '' Tuotteet erosivat hinnasta, matka -ajasta ja takuusta. Takuua ei analysoitu. Sitä käytettiin yksinkertaisesti muunnelman luomiseen, jotta muutoin samanlaiset kohteet voitaisiin esittää kahtena kappaleena. Se tasapainotettiin kaikkien muiden muuttujien kanssa. Tyypillinen luettelo arvioitavista kohteista oli:

Huomaa, että tässä luettelossa kummankin 8 hengen ryhmän kahden ensimmäisen kohteen hintaluokka on 40 dollaria ja aikaväli 1 tunti. Vastakkaisessa tilassa aika -alue oli 2 tuntia (0–2 tuntia) ja hintaluokka 20 dollaria (90–110 dollaria). Suurikokoisissa olosuhteissa hinta yksinkertaisesti kerrottiin kolmella, joten valikoima kerrottiin myös kolmella. Kaksi tavaraa, CD-soitin ja televisio, ilmestyivät kahdessa järjestyksessä eri aiheille. Yhdessä järjestyksessä ehdot olivat:
CD, edullinen hinta, korkea hintaluokka (alhainen aikaväli)
TV, korkea hinta, korkea hintaluokka
CD, edullinen hinta, korkea aikaväli (matala aika -alue)
TV, korkea hinta, pitkä aikaväli.
Toisessa järjestyksessä olosuhteet käännettiin.

Kahden ensimmäisen ja toisen luokituksen välissä olivat WTP- ja ero -ehdot (aina tässä järjestyksessä). Tyypillinen tuote WTP -tilassa lukee: `` Aiot ostaa 110 dollarin CD -soittimen 1 tunnin matkan päässä olevasta kaupasta. Mikä on suurin aika, jonka olisit valmis käyttämään matkoille ostaaksesi sen sen sijaan 100 dollarilla? '' Tai '' Mikä on suurin summa, jonka olisit valmis maksamaan yhdestä, joka on 30 minuuttia. Koehenkilö neuvottiin vastaamaan kokonaishinnan tai ajan perusteella. Ensimmäiselle tilaukselle WTP -ehdot järjestettiin taulukon 1 mukaisesti, ja ne käännettiin toiselle tilaukselle.

Pöytä 1.
Tavaroiden käyttö WTP -olosuhteissa kokeessa 1. Oikeassa reunassa olevassa sarakkeessa ovat päättelydollarin geometriset keskiarvot.

Ero -tuomiossa tyypillinen kohde oli:

Kumpi ero on sinulle tärkeämpi?
1. Ero 90 ja 100 dollarin välillä CD -soittimessa.
2. Ero 30 minuutin ja 1,5 tunnin matka -ajan välillä.

Kuinka monta prosenttia suuremmasta erosta on pienempi ero sen suhteen, kuinka paljon sillä on väliä?

(Jälkeenpäin ajateltuna tämän kohdan sanamuotoa on vaikea ymmärtää. Tietoanalyysissä kuitenkin poistettiin kohteita, jotka osoittivat väärinkäsityksiä vastaamalla päinvastaisella tavalla.)

Ensimmäisen tilauksen kohdat on esitetty taulukossa 2 (käänteinen toiselle tilaukselle). Huomaa, että vaihteluväli oli sekä hinta että aika: kun hintaluokka on korkeampi, aikaväli on pienempi. Tämä tekee kantaman käsittelystä vahvempaa.

Taulukko 2.
Koe 1 -erotehtävässä käytetyt kohteet. Taulukossa esitetään vastausten hyvä, vertailuvälit ja geometrinen keskiarvo.

Tulokset

Suunnittelu mahdollisti johtopäätöksen dollarin ja tunnin välisestä kompromissista kaikissa olosuhteissa. Arvioiden osalta laskin ortogonaalisen kontrastin hinnan ja ajan vaikutuksille luokituksiin ja otin suhteen. Laskin geometrisen keskiarvon kohteiden välillä ja tein tilastolliset testit logaritmeille. (On mielivaltaista käyttää suhdetta vai sen vastavuoroista. Lokin käyttö tarkoittaa, että tämä valinta vaikuttaa vain merkkiin, ei etäisyyteen nollasta.)

Luokitusten osalta päätellystä ajan rahallisesta arvosta vaikutti suuruus (sekoitettiin alueeseen), mutta se ei vaikuttanut pelkästään alueeseen.(Geometrinen keskiarvo) -arvot olivat (kohteille, joilla oli riittävästi tietoa molemmissa olosuhteissa): 20,32 dollaria suurille rahasummille ja 89,33 dollaria pienille määrille (t47 = 13,71, p = 0,0000) ja 43,60 dollaria, kun raha -alue oli pieni (ja aikaväli suuri) verrattuna 46,13 dollariin, kun raha -alue oli suuri (ja aika pieni).

WTP: n osalta geometriset keskiarvot päätellyistä dollareista tunnissa esitetään taulukossa 1. T-testit asiaankuuluvien ehtojen keskiarvoista (esim. Kaikki korkeat dollarit vs. kaikki alhaiset dollarit) osoittivat, että aika oli arvokkaampi dollarin suuruusluokassa oli korkeampi (t52 = 11,4, p = 0,0000) ja kun kohde vastasi rahalla eikä ajalla (t44 = 8,14, p = 0,0000). Koehenkilöt maksoivat myös enemmän ajasta, kun aika -alue oli pieni tai kun raha -alue oli suuri, pitäen suuruusluokkaa vakiona (t51 = 4,34, p = .0001). Yhteenvetona voidaan todeta, että WTP -mittari osoitti sekä suuruus- että etäisyysvaikutuksia, kun taas luokitusmitta osoitti vain suuruusvaikutusta.

Eroarvioinnit osoittivat myös molempien alueiden vaikutuksia (t47 = 3,85, p = .0004) ja suuruus (t47 = 5,69, p = 0,0000), kuten on esitetty taulukossa 2. Suuruus sekoitettiin alueeseen. Joten näitä vaikutuksia voidaan pitää toisintona havainnosta, jonka mukaan vastaavat tuomiot eivät ole herkkiä vaihteluvälille (esim. Fischer, 1995, katso Baron, 1997a, keskusteluun).

Yhteenvetona tuloksista, kaikki kolme mittausta - kokonaisarvioinnit, maksuvalmius ja eroarviointi - vaikuttivat suuruuteen (sekoitettiin vaihteluvälin kanssa), mutta pelkkä vaihteluväli vaikutti vain eroarvioihin ja WTP: hen. Yksi selitys näille tuloksille on, että WTP- ja erotehtävät esittivät vertailtavan alueen kaksi päätä, mikä rohkaisi tutkittavia pitämään näitä kahta päätä asiaankuuluvina vertailukohtina. Kokonaisarvosanat sitä vastoin ovat saattaneet sallia tutkittavien hyväksyä implisiittisen nollan kunkin alueen alarajaksi.

Olipa selitys mikä tahansa, tosiasia on edelleen se, että suuruusvaikutukset tekevät näistä tehtävistä epätyydyttäviä kompromissimittareina.

Koe 2

Koe 2 manipuloi vaihteluväliä ja suuruutta paikallisesti neljän hypoteettisen oston ryhmän sisällä esittämällä kaksi kohdetta alueen määrittämiseksi ja sitten kaksi muuta testatakseen kahden ensimmäisen vaikutuksen. Alue manipuloitiin pitämällä jokaisen ulottuvuuden yläosa vakiona ja vaihtamalla alaosaa: yhdessä tilanteessa rahat vaihtelivat 120 dollarista 80 dollariin ja aika 120 minuutista 0 minuuttiin, ja toisessa tapauksessa raha vaihteli 120 dollarista 100 dollaria ja aika 120-60 minuuttia. Suuruusluokan manipulointi lisäsi hintaan vain 100 dollaria pitäen vaihteluvälin vakiona.

Menetelmä

Kahdeksankymmentä tutkittavaa - 25% miehiä, 51% opiskelijoita, 16-51 -vuotiaat (mediaani 23) - täytti kyselylomakkeen Internetissä 5 dollarilla. Kysely alkoi:

Ostokset: aikaa ja rahaa

Tässä on kyse siitä, miten ihmiset tekevät kompromisseja ajan ja rahan välillä ostaessaan kulutustavaroita. Kuvittele, että kaikki kohteet viittaavat johonkin ääni- tai videolaitteeseen, kuten CD-soittimeen tai televisioon. Olet päättänyt ostaa tietyn mallin kullakin näytöllä ilmoitetusta hintaluokasta. Kysymys on siitä, oletko valmis matkustamaan jonkin matkan säästääksesi rahaa hinnassa.

Puolet ajasta arvioit yhden ostoksen kerrallaan 9-asteikolla (1 = erittäin epätodennäköistä ostaa, 5 = välinpitämätön, 9 = erittäin todennäköisesti ostaa). Muina aikoina vertaat kahta ostosta, myös 9-asteikolla (1 = A on paljon parempi, 5 = sama, 9 = B on paljon parempi). Jotkut ostokset toistetaan useita kertoja. Tämä ei ole ärsyttää sinua, mutta varmista, että kiinnität huomiota niiden olemassaoloon. Kun näet nämä toistuvat ostokset, sinun ei tarvitse antaa samaa vastausta kuin aiemmin, mutta voit, jos haluat.

On 56 kysymysnäyttöä (2 tai 4 kysymystä ruudulla) ja sen jälkeen muutama sinua koskeva kysymys.

Jokaisella yksittäisen ostoksen arviointinäytöllä (lyhyesti arviointi) oli neljä ostosta ja jokaisella ostovertailunäytöllä kaksi. Ostokset kuvattiin hinnan ja ajan suhteen, esim. `` $ 100, 60 minuuttia ''. Taulukossa 3 esitetään sekä arviointi- että vertailuehdoissa käytetyt perusarvot:

Taulukko 3.
Perusehdot kokeelle 2. Jokainen rivi edustaa yhdellä näytöllä esitettyjä kohteita. Vertailutilanteessa koehenkilö vertasi A: ta ja B: tä ja sitten C: tä ja C: tä. Arviointitilassa koehenkilö arvioi A, B, C ja D. ) ja dollarin vaihteluväli (100-120). Tapauksissa 8-14 aikaväli on korkea (60-120) ja dollarin vaihteluväli korkea (80-120).

Jokaisessa vertailunäytössä esitettiin vertailu A: sta ja B: stä sekä C: stä ja D: stä. Jokainen arviointinäyttö esitti A, B, C ja D erikseen. Huomaa, että tämän perusrakenteen puitteissa ensimmäisten seitsemän ostoksen aikavyöhyke (0-120 min) on suuri ostoille A ja B ja alhainen hintaluokka (100-120 dollaria). Toiset seitsemän ostosta ovat päinvastaisia ​​(60–120 min. Vs. 80–120 dollaria). Kunkin näytön kaksi viimeistä ostosta ovat samat vastaaville tuotteille. Näin ollen suhteellisten ajanjaksojen ja hintojen vaikutukset määritetään tarkastelemalla ostosten C ja D vastauksia. Huomaa myös, että vaihteluvälien huiput ($ 120 ja 120 min.) Ovat vakiorakenteen kohteiden sisällä.

Tämä perusmalli toistettiin neljä kertaa 56 näytön valmistamiseksi. Toistot 1 ja 2 olivat vertailuja, 3 ja 4 arviointeja. (Ohjelmointivirheen vuoksi arviointitiedot katosivat 28 koehenkilöstä, jäljelle jäi 52.) Toistot 2 ja 4 laajensivat hintojen suuruutta ja vaihteluväliä lisäämällä 100 dollaria kuhunkin hintaan. Toistojen 2 vertailu 1: llä ja 4 3: lla testaa sitten suuruusvaikutusta.

56 näytön järjestys satunnaistettiin erikseen jokaiselle aiheelle.

Tulokset

Kompromissin mittana laskin suhteellisen etusijan vaihtoehtoon alhaisemmalla hinnalla (ja pidemmällä ajalla). Jos ihmiset arvioivat hintaa ja aikaa suhteessa alueisiinsa, tämä suhteellinen etusija olisi suurempi, kun hintaluokka on pieni ja aikaväli on korkea. Tämä tulos tapahtui arvioinneissa (t51 = 4,67, p = 0,0000), mutta ei vertailuissa (t = 0,94). Arviointikohteissa, kun hintaluokka oli pieni, koehenkilöt suosivat halpaa tuotetta keskimääräisellä luokituserolla 0,30, mutta kun alue oli korkea, he suosivat vähäaikaista tuotetta 0,34.

Yksinkertainen selitys tälle tulokselle on, että arviointitilassa koehenkilöt huolehtivat kaikista neljästä näytöstä, jotka esitetään jokaisessa näytössä. Kun jokin tuotteista sisältää erittäin alhaisen hinnan, se antaa sille korkean arvosanan, mutta silloin he kokevat velvollisuutensa antaa alempi luokitus tuotteelle, jolla ei ole niin alhaista hintaa. Yhteenvetona voidaan todeta, että arviointikohteiden osalta kaksi ensimmäistä kohtaa muodostivat erilaisia ​​vastauksia. Vertailukohteissa sitä vastoin koehenkilöt yksinkertaisesti vertaavat annettuja kahta kohdetta. He eivät tunne olevansa sidottuja vastauksiinsa muihin saman näytön kohteisiin.

Koehenkilöillä ei ollut merkittävää suuruusvaikutusta kummassakaan tilassa. Vaikka tämä tulos vaikuttaa optimistiselta, aluevaikutuksen läsnäolo heikentää optimismia käyttää tätä tehtävää arvon kompromissien mittaamiseen. Suuruusvaikutus voi riippua siitä, että rohkaistaan ​​kohdetta käyttämään 0 vertailukohtana. Kun ulottuvuuden molemmat päät on nimenomaisesti ilmoitettu (esim. 120 minuuttia ja 80 minuuttia) - sen sijaan, että jätät implisiittiseksi, että toinen pää on 0 - alueen vaikutukset voivat ottaa vallan.

Koe 3

Kokeet 1 ja 2 osoittavat joko aluevaikutuksia tai suuruusvaikutuksia kokonaisvaltaisessa luokituksessa. Huolimatta Beattien ja Baronin (1991) lupaavista tuloksista, kokonaisvaltaisten luokitustehtävien käyttö ei näytä tarjoavan luotettavaa keinoa johdonmukaisiin kompromissimittauksiin. Sen tarjoamat toimenpiteet näyttävät riippuvan siitä, mitä kohteet käyttävät kunkin asteikon ylä- ja alareferenssipisteenä.

Toinen tapa saada aikaan johdonmukaisia ​​kompromisseja on kohdata vastaaja epäjohdonmukaisuuksiinsa ja pyytää häntä ratkaisemaan ne. Tätä on vaikea tehdä kokonaisvaltaisissa arviointitehtävissä, koska vastaajan olisi käsiteltävä paljon vastauksia kerran. Kun vastaaja tekee suoria suhteellisia arvioita, epäjohdonmukaisuuden ratkaiseminen voi kuitenkin olla helpompaa.

Koe 3 on esimerkki yhdestä menetelmästä, jota voitaisiin käyttää epäjohdonmukaisuuden ratkaisemisessa. Se sisältää hyödyllisyysvälien vertailun. Esimerkkejä mahdollisista aikaväleistä ovat '' ero 60--120 minuutin välillä '', '' 90--120 dollarin ero '' ja '' normaalin terveyden ja täydellisen hiustenlähtön välinen ero ''. kiinnostusta terveyspalveluiden mittaamiseen. Jos esimerkiksi halusimme selvittää, onko syövän kemoterapian hyöty hintansa arvoinen, osa kustannuksista voi olla hoidon sivuvaikutuksia. Tavallinen tapa mitata terveydenhuollon hyötyjä on verrata kaikkea `` normaalin terveyden '' ja `` kuoleman '' väliseen aikaan. Poliitikot päättävät usein, että tällä aikavälillä on sama hyöty kaikille.

Koe 3 koskee tällaisia ​​terveysvälejä kuin aikaa ja rahaa. Kohde arvioi intervallin A hyödyllisyyden suhteessa B: hen, B: n suhteessa C: hen ja A: n suhteeseen C. AC -osuuden tulisi olla AB -osuuden ja BC -osuuden tulo. Tyypillisesti AC -osuus on liian korkea (kuten aiemmin totesin), mikä on eräänlainen epäherkkyys vertailustandardille.

Tässä käytetyssä menetelmässä koehenkilö pakotetaan ratkaisemaan epäjohdonmukaisuus, mutta hänelle ei kerrota, miten se ratkaistaan. Aihe vastaa kolmeen kysymykseen tietokoneen näytöllä. Jos ne ovat epäjohdonmukaisia, painikkeet näkyvät ruudulla jokaisen tuomion vieressä. Kukin painike sanoo `` Lisää '' tai `` Vähennä '' sen mukaan, onko tuomio liian matala vai liian korkea verrattuna kahteen muuhun tuomioon. Jokainen painike nostaa tai laskee siihen liittyvää vastausta yhdellä yksiköllä. Aihe voi tehdä vastauksista johdonmukaiset napsauttamalla mitä tahansa tai kaikkia painikkeita.

Tässä kokeessa käytettiin kolmea eri välin vertailumenetelmää: aika kompromissi (TTO), standardi uhkapeli (SG) ja suora luokitus (kahdessa versiossa, DT ja DP, kuvataan). TTO -menetelmässä koehenkilö arvioi, kuinka monta viikkoa yhdellä terveydentilalla vastasi 100 viikkoa vähemmän vakavalla terveydentilalla. Vastauksen suhde 100: een mitataan vähemmän vakavan terveydentilan hyödyllisyydestä suhteessa vakavampaan, olettaen, että aika ja hyöty lisääntyvät kokonaishyötyksi. SG -menetelmässä koehenkilö antaa todennäköisyyden vakavammasta terveydentilasta, ja tätä pidetään vähemmän vakavan tilan hyödyllisyyden mittana, olettaen, että odotettu hyöty on ratkaiseva. Suora luokitusmenetelmä pyytää yksinkertaisesti välien vertailua.

Vertailtavat välit rakennettiin manipuloimalla joko terveydentilaa tai sen todennäköisyyttä tai kestoa. Jokaista väliä rajoitti normaali terveys toisessa päässä. Kaikkia terveysolosuhteita käytettiin jokaisen aikavälisarjan toisessa päässä, yksi vakavampi ja yksi vähemmän vakava. TTO: n ja DP: n (jossa P tarkoittaa todennäköisyyttä) osalta kolmas ehto oli 50%: n mahdollisuus vähemmän vakavaan terveydentilaan. SG: n ja DT: n (T ajan) osalta kolmas sairaus oli 50 viikkoa vähemmän vakavasta tilasta 100 viikon sijaan.

Ajatus terveydentilan manipuloinnista muuttamalla sen todennäköisyyttä tulee Brunerilta (1999). Bruner oli kiinnostunut mittaamaan eturauhassyövän hoitojen, seksuaalisen impotenssin ja virtsainkontinenssin suurimman sivuvaikutuksen hyötyjä. Hän käytti aika-kompromissimenetelmää. Hän kysyi tutkittavilta itse asiassa, kuinka suuren osan eliniänsä he uhrasivat sen sijaan, että saisivat hoitoa, joka antaisi heille esimerkiksi 80%: n mahdollisuuden impotenssiin tai 40%: n mahdollisuuden. Laajalla todennäköisyysalueella vastaus tähän kysymykseen oli epäherkkä todennäköisyydelle. Koehenkilöiden halukkuus uhrata elinajanodote ei riippunut siitä, oliko impotenssin todennäköisyys 40% tai 80% (vaikka he olivat hieman vähemmän halukkaita, kun se nousi 99%: iin). Tällainen epäherkkyys todennäköisyydelle tekee toimenpiteestä hyödyttömän keinona saada aikaan arvioita impotenssin hyödyllisyydestä.

Kriittinen kysymys on se, jossa verrataan alennettua vähemmän vakavaa terveydentilaa (50% tai 50 päivää) vakavampaan tilaan. Jotta tämä olisi hyvä hyödyllisyysmittari, vastauksen pitäisi olla puolet siitä kysymyksestä, jossa vertaillaan alennettua lievempää tilaa vakavampaan tilaan. Johtaako säätöprosessi tähän tulokseen?

Menetelmä

Kuusikymmentäkolme koehenkilöä täytti kyselylomakkeen Internetissä 3 dollarilla. Koehenkilöt olivat 60% naisia, 51% opiskelijoita ja heidän keski -ikä oli 24 (vaihteluväli: 13-45). Kolme lisäaihetta ei käytetty, koska ne antoivat saman alkuperäisen vastauksen jokaiselle kohderyhmälle.

Tutkimuksen johdanto, nimeltään `` Terveysarvioinnit '', alkoi:

Tämä tutkimus koskee erilaisia ​​tapoja saada aikaan numeerisia arvioita terveyden laadusta. Jos voisimme mitata esimerkiksi terveyslaadun heikkenemistä eri syöpähoitojen sivuvaikutuksista, voisimme auttaa potilaita ja päätöksentekijöitä päättämään, ovatko hoidon hyödyt kustannusten arvoisia.

Sivuvaikutukset on aina kirjoitettu isoilla kirjaimilla. Tässä ovat vaikutukset:

HIUKSET (täydellinen)
NAUSEA (ruoan kulutus puolet normaalista)
DIARRHEA (kolme kertaa päivässä)
Väsymys (tarpeeksi työkyvyttömäksi)
On myös tehosteyhdistelmiä.

Jossain kysymyksessä teet kaksi vaihtoehtoa tasavertaiseksi sanomalla, kuinka paljon aikaa yhdellä sivuvaikutuksella vastaa pidempää aikaa jonkin muun sivuvaikutuksen kanssa, joka ei ole niin paha. Joissakin tapauksissa sivuvaikutukset eivät ole varmoja.

Muista kokeilla harjoitustarvikkeita ennen kuin jatkat.

Yhdessä kysymyksessä annat ajan. Sinun on vastattava numerolla 0 - 20. Käytä vapaasti desimaaleja. Tässä on esimerkki (kuurous):

A. 100 viikkoa kuuroutta.
B. 50 viikkoa sokeuden ja kuuruuden kanssa.

Voit vastata tähän valitsemalla B: lle numeron, jotta molemmat vaihtoehdot ovat yhtä suuret. Yritä valita eri viikkoja B: lle ylös ja alas, kunnes tunnet A: n ja B: n olevan yhtä suuret. Tee tämä nyt napsauttamalla yhtä näistä kahdesta painikkeesta:

Painikkeet oli merkitty `` A on huonompi nyt '' ja `` B on huonompi nyt ''. Yhden painikkeen napsauttaminen sääti laatikon päivien määrää pienemmillä summilla. Seuraava harjoituskohde käyttää todennäköisyyden sijaan aikaa kahden vaihtoehdon rinnastamiseen. Koehenkilöille kerrottiin myös luokituseristä ja heille kerrottiin kohteiden määrä. Lopulta heille kerrottiin:

Kohdat muotoiltiin seuraavasti: S1 oli kahdesta oireesta lievempi ja S2 vakavampi. S1 oli aina yksi neljästä luetellusta oireesta. S2 oli joko kaksi oireista, mukaan lukien S1 (esim. NAUSEA JA FATIGUE, kun S1 oli NAUSEA) tai kaikki neljä. (Jokainen oire esiintyi yhtä usein parin jäsenenä.)

Ajan kompromissi

Täytä jokainen tyhjä niin, että kaksi vaihtoehtoa ovat samat.

A. 50%: n mahdollisuus S1: lle 100 viikon ajan
B. S1 ___ viikon ajan

A. S1 100 viikon ajan
B. S2 ___ viikon ajan

A. 50%: n mahdollisuus S1: lle 100 viikon ajan
B. S2 ___ viikon ajan

Normaali uhkapeli

Täytä jokainen tyhjä niin, että kaksi vaihtoehtoa ovat samat.

A. S1 50 viikon ajan
B. ___% todennäköisyys S1: lle 100 viikon ajan

A. S1 100 viikon ajan
B. ___% todennäköisyys S2: lle 100 viikon ajan

A. S1 50 viikon ajan
B. ___% todennäköisyys S2: lle 100 viikon ajan

Suora tuomio (aika)

Jos normaalin terveyden ja 100 S1 -viikon välinen ero on 100, kuinka suuri ero normaalin terveyden ja S1 -viikon 50 välillä on?

Jos normaalin terveyden ja 100 S2 -viikon välinen ero on 100, kuinka suuri on normaalin terveyden ja 100 S1 -viikon välinen ero?

Jos normaalin terveyden ja 100 S2 -viikon välinen ero on 100, kuinka suuri ero normaalin terveyden ja S1 -viikon 50 välillä on? Suora arviointi (todennäköisyys)

Jos normaalin terveyden ja S1: n ero on 100, kuinka suuri ero normaalin terveyden ja S1: n 50%: n todennäköisyyden välillä on? Kaikki tämän esimerkin oireet ovat 100 viikon ajan.

Jos normaalin terveyden ja S2: n välinen ero on 100, kuinka suuri ero normaalin terveyden ja 100%: n todennäköisyyden välillä on S1?

Jos normaalin terveyden ja S2: n välinen ero on 100, kuinka suuri ero normaalin terveyden ja S1: n 50 prosentin todennäköisyyden välillä on?

Jokaisen vastauslaatikon oikealla puolella oli painike, tyhjä alussa. Kun vastaukset oli täytetty, ohjelma tarkisti ensin, onko kolmas vähemmän kuin muut, ja vaati vastausten muuttamista, jos ei. Sitten ohjelma tarkisti, olivatko ne johdonmukaisia. Johdonmukaisuus määriteltiin kolmen vastauksen suhteen perusteella: kun kaikki vastaukset oli jaettu sadalla, kolmannen vastauksen oli oltava kahden muun tulos lähimpään yksikköön. Jos vastaukset olivat johdonmukaisia, aihe voisi siirtyä seuraavaan näyttöön. Jos kolmas vastaus oli liian korkea, sana `` Lisää '' ilmestyi kahdessa ensimmäisessä painikkeessa ja `` Pienennä '' ilmestyi kolmannessa painikkeessa. Kohde napsautti mitä tahansa kolmesta painikkeesta, kunnes käskettiin jatkaa. Kukin painike sääsi vasteella 1 yksikköä, ylöspäin lisäyksille ja alas laskuille. (Kohde voi myös kirjoittaa vastauksen.) Jos kolmas vastaus oli liian matala, `` Lisää '' ja `` Pienennä '' vaihdettiin. Kohteen oli saatava vastaukset johdonmukaisiksi ennen siirtymistä seuraavaan näyttöön.

Tulokset

Koehenkilöt olivat alun perin epäjohdonmukaisia ​​ja herkkiä todennäköisyydelle ja ajalle, kuten odotettiin. Vaatimus niiden johdonmukaisuudesta teki heistä herkempiä todennäköisyydelle ja ajalle.

Kunkin näytön epäjohdonmukaisuuden mitta oli kolmannen vastauksen ja kahden ensimmäisen vastauksen tulon välisen suhteen logi (pohja 10) (kun kaikki vastaukset on jaettu 100: lla). Tämä olisi 0, jos vastaukset olisivat johdonmukaisia. Keskimääräinen epäjohdonmukaisuus kaikissa neljässä herätysmenetelmässä oli .0245 (t63 = 3.45, p = .0010), mikä tarkoittaa, että kolmas vastaus oli noin 6% liian korkea, laskettuna tällä tavalla. Neljä menetelmää erosivat tämän vaikutuksen koosta (F.3,189 = 5,57, p = 0,0011).

Tärkein epäherkkyyden mitta todennäköisyyteen ja aikaan oli kolmannen vastauksen suhde toiseen, miinus -5. (Normatiivinen standardi oli .5.) Tämä mitta oli odotetusti positiivinen, jos koehenkilöt mukautuvat liian vähän todennäköisyyden ja ajan muutoksiin toisen ja kolmannen vastauksen välillä. Keskiarvo oli .0260 (t63 = 2,96, p = 0,0043). Neljä menetelmää erosivat tämän vaikutuksen koosta (F.3,189 = 6,49, p = .0001): .0145 ajan kompromissille, .0475 uhkapelille, .0284 suoralle arvioinnille (todennäköisyys) ja .0135 suoraajalle.(Huomaa, että näitä eroja ei voida ymmärtää siten, että niihin liittyy ajan ja todennäköisyyden vaikutuksia.)

Vastaus ensimmäiseen kysymykseen ei poikennut merkittävästi kokonaisuudesta .5, vaikka neljä menetelmää eroavat toisistaan ​​(F.3,189 = 5,33, p = 0,0015), keskiarvolla 0,4714 ajan kompromissille, .5083 tavalliselle uhkapelille, .5042 suoralle ajalle ja .5106 suoralle todennäköisyydelle.

Suurin kiinnostuksen tulos koski toisen ja kolmannen kysymyksen suhdetta. Olisi pitänyt olla .5, mutta sen keskiarvo oli kaikissa menetelmissä, kuten todettu, liian korkea .0260. Johdonmukaisuuden säätämisen jälkeen keskiarvo oli .0050, ei merkittävästi erilainen kuin 0. Muutos oli merkittävä (t63 = 3,65, p = .0005). Tämä tulos voi kuitenkin syntyä keinotekoisesti, jos kolmannen vastauksen säätöpainike sanoi Vähennä useammin kuin se sanoi Lisää, olettaen, että muutoksen suunta ei vaikuttanut muutoksen suuruuteen. Näin ollen laskin lisäyksen ja vähennyksen kokeiden mittauksen erikseen. Vähennystutkimusten keskimääräinen muutos oli .0842 (alaspäin) ja lisäyskokeiden keskiarvo oli .0479 (ylöspäin). Niillä 52 potilaalla, joilla oli tietoja molemmista tapauksista, keskimääräinen ero näiden välillä oli .0382. Toisin sanoen alaspäin suuntautuva muutos oli suurempi kuin ylöspäin suuntautunut muutos, joten kokonaisuutena aiheista tuli johdonmukaisempia (t51 = 3,36, p = 0,0015). Säädön hyöty ei siis johdu vain siitä, että kohteet pakotetaan liikkumaan vaadittuun suuntaan. Kun heidät pakotettiin liikkumaan tähän suuntaan, he liikkuivat enemmän kuin silloin, kun heidän oli pakko liikkua vastakkaiseen suuntaan. He siirtyivät myös useammin entiseen suuntaan (66% mahdollisista tapauksista vs. 56% t51 = 1,76, p = .0422, yksi pyrstö).

Koe 4

Koe 4 havainnollistaa toista lähestymistapaa johdonmukaisuuden säätämiseen. Koehenkilöille annetaan arvio siitä, mitä heidän vastauksensa olisivat, jos he olisivat johdonmukaisia. Toisin kuin kokeessa 3, tutkittavien ei tarvitse säätää vastauksiaan. Heille annetaan oikaistut vastaukset vain ehdotuksena. Kysymys on siitä, hyväksyvätkö he ehdotuksen ja ovatko he johdonmukaisempia.

Kokeessa 4 käytettiin kolmea eri terveydentilaa sen sijaan, että käytettäisiin kahta terveydentilaa, joista toinen oli diskontattu. Se käytti vain kahta menetelmää, ajan kompromissia ja suoraa luokitusta.

Menetelmä

58 tutkittavaa vastasi kyselylomakkeen Internetissä 5 dollarilla. Koehenkilöt olivat 65% naisia, 38% opiskelijoita ja heidän mediaani -ikänsä oli 27 (vaihteluväli: 12-69).

Tutkimuksen johdanto, nimeltään `` Terveysarvioinnit '', alkoi:

Tämä tutkimus koskee erilaisia ​​tapoja saada aikaan numeerisia arvioita terveyden laadusta. Jos voisimme mitata terveydentilan heikkenemistä eri olosuhteista, voisimme mitata näiden sairauksien hoidon tai ehkäisemisen hyödyt. Tämä mahdollistaisi resurssien tehokkaamman kohdentamisen.

Ehdot, joita harkitsemme ovat:
LÄHIYTTÄVYYS (tarvitaan silmälaseja)
SOKEUS YHDESSÄ SILMÄSSÄ
SOKEUS TOTAL
OSAPUOLINEN KUUROUS (kuulokoje palauttaa normaalin kuulon)
Kuurous yhdessä korvassa (täydellinen, kuulokoje ei auta)
KOKO KUURAUS
Kävelyn menetys yhdellä jalalla
Kävelyn menetys molemmissa jaloissa
KAIKEN RAJOJEN PARALYYSI
LEIKKAUS INDEKSI SORMASSA (hallitseva käsi)
SPLINT ON HAND (hallitseva puoli)
SPLINT ON ARM (hallitseva puoli) CAST ON JALKA
VALITSE JALALLA
KÄYTÄ Kummassakin jalassa
KULMAKULMAT
HIUKSEN HÄVITTÄMINEN KASVOLTA JA PÄÄTÄ
KAIKKI HIUKSET (mukaan lukien kasvot ja pää)

Huomaa, että nämä olosuhteet ovat kuudessa kolmen hengen ryhmässä. Kussakin ryhmässä olosuhteet on järjestetty vakavuuden mukaan. Koehenkilön oli tehtävä aika-kompromissiharjoituksia ennen aloittamista, kuten viimeisessä kokeessa. Heille kerrottiin myös luokituseristä. Heille kerrottiin kysymysten määrä ja heitä kannustettiin käyttämään desimaaleja vastauksissaan.

Ensimmäiset 36 tutkimusta sisälsivät 18 aika-kompromissituomiota ja 18 suoraa tuomiota. Jokainen aika-kompromissi-esite otettiin käyttöön `` Kuinka monta päivää tekee näistä kahdesta tuloksesta saman? '' Suoran tuomion kohteet muotoiltiin samalla tavalla kuin käytännön kohde.

Koehenkilö teki jokaisen arviointityypin kolme kertaa kunkin kuuden ehtoryhmän osalta. Kussakin olosuhteiden ryhmässä kohde vertasi ensimmäistä ja toista, ensimmäistä ja kolmatta ja toista ja kolmatta. S1 ja S2 edustavat näin ollen arvioitavia olosuhteita, esim. `` SINÄSYYS YHDESSÄ SILMÄSSÄ '' ja `` TOTAL BLINDNESS ''. Käyttämällä kaikkia kolmea vertailua voisin testata sisäisen johdonmukaisuuden. Erityisesti ääripäiden arvioinnin (ensin suhteessa kolmanteen) tulisi olla kahden muun tuomion tulos (suhteina). Nämä 36 tutkimusta esitettiin satunnaisessa järjestyksessä, kukin omalla näytöllä, joka katosi, kun koehenkilö vastasi.

Näiden 36 kokeen jälkeen koehenkilö näki 24 näyttöä, joissa oli kolme tuomiota näytölle, jälleen satunnaisessa järjestyksessä. Nämä koostuivat kahdentyyppisistä tuomioista, joista jokainen oli koulutettu ja kouluttamaton versio, kuhunkin olosuhteiden ryhmään.

Sekä koulutetuissa että kouluttamattomissa olosuhteissa jokainen näyttö alkoi: '' Vastaa kaikkiin kolmeen kohtaan uudelleen annetuissa laatikoissa. Sinun ei tarvitse antaa samaa vastausta kuin antamasi, eikä sinun tarvitse tehdä vastauksistasi johdonmukaisia. Yritä saada vastauksesi heijastamaan todellista harkintaasi. ''

Koulutetun suoran tuomion tilassa seuraavassa kappaleessa lukee: `` Toinen sarake näyttää yhden tavan saada vastauksesi suhteet yhteen. Toisen rivin prosenttiosuus on ensimmäisen ja kolmannen rivin prosenttiosuuden tulo. Koulutetussa aika-kompromissitilassa viimeisessä virkkeessä lukee: `` Päivien toisen rivin suhde (100: een) on ensimmäisen ja kolmannen rivin suhteiden tulos. Tämä olettaa, että kaikki päivät lasketaan yhtä paljon. ''

Koehenkilö näki sitten taulukon, jossa oli vasemmalla olevat kohteet ja joko kaksi tai kolme numerosaraketta, esimerkiksi:

Ajan kompromissiksi vasemmassa yläkulmassa olisi lukenut: `` 100 päivää KUURAUTUMISTA YHDESSÄ KORVASSA oli yhtä huono kuin 5 päivää OSALLISTA VAHVUUTTA '', ja toisessa sarakkeessa olisi päiviä prosenttilukujen sijaan. Kouluttamattomassa tilassa toinen sarake jätettiin pois. Viitataan kolmeen vertailuun AB, BC ja AC kolmella rivillä. AB ja BC ovat vierekkäin ja AC on äärimmäinen.

Toisen sarakkeen yhdenmukaiset arvot laskettiin kahden vierekkäisen vertailun suhteen säilyttämiseksi ja muutoin vastausten yhdenmukaistamiseksi. Kaksi vierekkäistä vertailua (AB ja BC) kerrottiin korjauskertoimella ja äärimmäinen vertailu (AC) jaettiin samalla kertoimella. (Korjauskertoimen ei rajoitettu olevan suurempi tai pienempi kuin yksi.) Erityisesti korjauskerroin oli [AC/(AB ·BC)] 1/3. Oikeat arvot pyöristettiin lähimpään yksikköön, mutta tutkittavaa kehotettiin käyttämään desimaaleja.

Tulokset

Laskin kullekin ehtoryhmälle epäjohdonmukaisuuden mittauksen: log10[AC/(AB ·BC)]. (Suhteen suunta on mielivaltainen. Se voitaisiin kääntää. Loki varmistaa, että inversio vaikuttaisi vain epäjohdonmukaisuuden merkkiin, ei sen suuruuteen.) Laskin tämän mittauksen keskiarvon kuuden ehtojoukon osalta kullekin kahdelle menetelmälle , alkuvaiheessa, koulutetuissa ja kouluttamattomissa olosuhteissa. Laskin myös absoluuttisen arvon epäjohdonmukaisuusmittarin kullekin ehtoryhmälle ja keskiarvoin sen samalla tavalla. Taulukko 4 esittää näiden kahden toimenpiteen keskiarvot molemmille menetelmille.

Taulukko 4.
Keskimääräiset epäjohdonmukaisuusmittarit molemmille menetelmille.

Koulutetut kohteet olivat johdonmukaisempia kuin kouluttamattomat, jotka puolestaan ​​olivat johdonmukaisempia kuin alkuperäiset, sekä allekirjoitetuilla että absoluuttisilla mittareilla. Testasin tämän neljällä varianssianalyysillä, joista yksi oli alustava vs. kouluttamaton ja toinen kouluttamaton vs. koulutettu, kumpaakin epäjohdonmukaisuusmittaa varten. On tarpeetonta vertailla peruskoulutusta ja koulutusta. Mutta alkuvaiheen ja kouluttamattoman vertailu testaa (sekavat) vaikutukset, kun esineet tehdään yhdessä ryhmässä ja tehdään ne toisen kerran. Alkuperäinen vs. kouluttamaton vaikutus oli merkittävä allekirjoitetuille toimenpiteille (F.1,57 = 68,2, p = 0,0000) ja allekirjoittamattomille mittauksille (F1,57 = 62,0, p = 0,0000). Aika-kompromissin ja suoran tuomion vaikutus oli merkittävä vain absoluuttisille mittareille (F.1,57 = 17,9, p = .0001): aika-kompromissi oli vähemmän johdonmukainen. Kummassakaan tapauksessa vuorovaikutus menetelmän ja alkuperäisen vs. kouluttamattoman välillä ei ollut merkittävää. Parannus, joka johtui esineiden esittämisestä yhdessä ja uudelleen, oli läsnä molemmissa menetelmissä.

Epäjohdonmukaisuus oli pienempi koulutetuilla kuin kouluttamattomilla sekä allekirjoitetuilla että allekirjoittamattomilla toimenpiteillä (F.1,57 = 8,14, p = 0,0060 ja F1,57 = 51,6, p = 0,0000). Menetelmän vaikutus oli jälleen merkittävä vain absoluuttiselle mittaukselle (F.1,57 = 13,1, p = .0006). Koulutuksen ja menetelmän välinen vuorovaikutus ei ollut merkittävä. Harjoittelu parantaa johdonmukaisuutta molemmissa menetelmissä.

Keskustelu

Kaksi ensimmäistä kokeilua täydentävät olemassa olevia esityksiä siitä, että kokonaisvaltaisiin luokituksiin kohdistuu joskus vieraita vaikutuksia aluevaikutusten tai suuruusvaikutusten muodossa. Voimme ottaa nämä vaikutukset huomioon yleensä olettaen, että koehenkilöt ottavat kullekin ulottuvuudelle kaksi vertailupistettä, ylhäältä ja alhaalta, ja arvioivat kohteen sijainnin suhteessa näihin vertailupisteisiin, ainakin osan ajasta. Toisin sanoen he ajattelevat vaihtelua ulottuvuutta pitkin suhteena etäisyydestä ylhäältä alas eikä absoluuttisena muutoksena ulottuvuudella, jonka yksiköillä on oma arvo. Tämä on joskus järkevä arviointimenetelmä, esimerkiksi arvioitaessa tenttiarvioita. Mutta sitä käytetään myös silloin, kun kohde voi arvioida yksiköt itsenäisesti.

Ylä- ja alaosa on hieman vaihteleva ja riippuu tehtävän yksityiskohdista. Kokeessa 1 havaittiin suuruusvaikutuksia kokonaisvaltaisissa luokituksissa, WTP: ssä ja eroarvioinnissa ajan ja rahan kompromississa. Se havaitsi aluevaikutuksia WTP: ssä ja eroarvioinnissa, mutta ei kokonaisvaltaisissa luokituksissa. Kuten on todettu, luokitustehtävä on saattanut poiketa muista tehtävistä siinä mielessä, että koehenkilöt olisivat voineet helpommin ottaa nollan käyttöön epäsuorana alarajana.

Kokeessa 2 käytettiin neljää kohdetta kerrallaan, ja kaksi ensimmäistä kohdetta määrittivät alueen. Se havaitsi aluevaikutuksia, kun koehenkilöt arvioivat kohteita yksi kerrallaan, mutta eivät silloin, kun he vertasivat yhtä kohdetta toiseen kysymyksessä. Mahdollinen selitys tälle tulokselle on, että vertailumuoto tarjoaa oman kontekstinsa, joten aiheet jättävät kontekstin huomiotta aiemmissa kysymyksissä. Jos näin on, suora vertailu voi olla hyödyllinen aluevaikutusten voittamisessa. Tämä johtopäätös olisi samanlainen kuin Fischerin (1995). Huomaa kuitenkin, että suora vertailu muistuttaa suuresti kokeissa 3 ja 4 käytettyjä suoria arviointitehtäviä.

Näissä kokeissa koehenkilöt vertasivat kahta aikaväliä sen sijaan, että tekisivät tuomion yhdestä kahden ominaisuuden ärsykkeestä. Kuten aiemmissa tutkimuksissa (Baron et ai., 1999 Ubel et al., 1996) todettiin, kaikki nämä toimenpiteet osoittivat suhteen epäjohdonmukaisuutta: koehenkilöt eivät antaneet tarpeeksi pieniä lukuja, kun he vertasivat pientä aikaväliä paljon suurempiin (tai päinvastoin) , he eivät antaneet muissa vastauksissaan tarpeeksi suuria lukuja). Kun tämä epäjohdonmukaisuus kiinnitettiin heidän tietoonsa, vastauksista tuli johdonmukaisempia. Tämä on suositeltu lähestymistapa sovellettuihin päätöksentekoanalyyseihin, ja toistaiseksi se näyttää toimivan ainakin siinä mielessä, että se antaa käyttökelpoisia ja johdonmukaisia ​​vastauksia.

Kokonaisvaltaisilla arvioilla on muita ongelmia. Kun vastaajia pyydetään arvioimaan usean ominaisuuden ärsykkeitä useilla ominaisuuksilla, he näyttävät osallistuvan vain muutamaan ominaisuuteen, jotka he pitävät erityisen tärkeinä, jättäen siten huomiotta vähemmän tärkeät ominaisuudet liikaa (Hoffman, 1960, kuvat 3-7 von Winterfeldt & amp; Edwards , 1986, s. 365). Tämä on kuitenkin todennäköisesti vähemmän vakava ongelma, kun vastaajat arvioivat kahta ominaisuutta kerrallaan. Silti alue- ja suuruusvaikutusten olemassaolo näyttää olevan vaikea välttää. Ainoa tapa välttää se näyttää olevan esittää selvät välit vertailua varten.

Tämä väite on johdonmukainen Birnbaumin ja hänen kollegoidensa (1978 Birnbaum & amp; Sutton, 1992) havainnon kanssa, jonka mukaan koehenkilöt, joita pyydettiin arvioimaan kahden ärsykkeen suhdetta (epälineaarisella vastefunktiolla) ärsykkeiden väliseen eroon pikemminkin kuin suhde etäisyydet nollasta (ei stimulaatiota, aistitehtävässä). Kuitenkin, kun aiheita pyydetään erojen suhteet - esim. mikä on suhde hyötyosuuden (tai äänenvoimakkuuden jne.) välillä A: n ja B: n välillä sekä C: n ja D: n välinen ero? - he perustavat vastauksensa erojen suhteeseen eivätkä eroihin. Näyttää siltä, ​​että kahden ärsykkeen suhdetehtävä sisältää neljä ärsykettä, koska viitepiste on implisiittinen, esim. Nolla äänenvoimakkuutta tai normaali terveys. Birnbaumin tuloksen voidaan kuitenkin olettaa viittaavan siihen, että meidän on ilmoitettava vertailukohta nimenomaisesti, jos haluamme aiheiden käyttävän sitä, joten teemme tämän, kun kysytään eroista.

Vertailukelpoisten alueiden loppujen ilmoittaminen on yksiselitteinen päätösanalyysin määräyksistä (Fischer, 1995), mutta sitä ei käytetä rutiininomaisesti muissa arvonmuodostustehtävissä. Tässä raportoidut tulokset viittaavat siihen, että tällainen selkeys aikavälien vertailussa on hyvä lähtökohta arvon saamiseksi. Loput prosessista edellyttävät johdonmukaisuuden tarkistamista ja vastaajien pyytämistä tekemään muutoksia. Tässä käytetyt tarkistukset ovat vain esimerkkejä monista muista, joita voitaisiin käyttää.

Viitteet

Baron, J. (1994). Miettii ja päättää (2. painos). New York: Cambridge University Press.

Baron, J. (1997a). Poikkeamat julkisten päätösten arvojen kvantitatiivisessa mittaamisessa. Psykologinen tiedote, 122, 72-88.

Baron, J. (1997b). Suhteellisen ja absoluuttisen riskin sekaannus arvioinnissa. Journal of Risk and Uncertainty, 14, 301-309.

Baron, J., & amp; Greene, J. (1996). Määrittämättömyyden määräävät tekijät julkisten hyödykkeiden arvioinnissa: panos, lämmin hehku, budjettirajoitukset, saatavuus ja näkyvyys. Journal of Experimental Psychology: Sovellettu, 2, 107-125.

Baron, J., Wu, Z., Brennan, D. J., Weeks, C., & amp; Ubel, P. A. (1999). Analoginen asteikko, suhdearviointi ja henkilöiden kompromissi hyödyllisyysmittauksina: harhat ja niiden korjaaminen. Käsikirjoitus.

Beattie, J., & amp; Baron, J. (1991). Ärsykealueen vaikutuksen määrittelyn painoon tutkiminen. Journal of Experimental Psychology: Human Perception and Performance, 17, 571-585.

Birnbaum, M. H. (1978). Psykologisen mittaamisen erot ja suhteet. Julkaisussa N.Castellan & amp.Restle (toim.), Kognitiivinen teoria, (Osa 3, s. 33-74). Hillsdale, NJ: Erlbaum.

Birnbaum, M. H., & amp; Sutton, S. E. (1992). Asteikon lähentyminen ja hyötymittaus. Organisaation käyttäytyminen ja ihmisen päätöksentekoprosessit, 52, 183-215.

Bruner, D. W. (1999). Eturauhassyövän hoidon mieltymysten ja apuohjelmien määrittäminen. Väitös, Sairaanhoitajakoulu, Pennsylvanian yliopisto.

Darke, P. R., & amp; Freedman, J. L. (1993). Päättäminen, etsitkö kauppaa: Sekä määrän että prosentin vaikutukset. Journal of Applied Psychology, 78, 960-965.

Fischer, G. W. (1995). Ominaisuuspainojen alueherkkyys monen määritteen arvomalleissa. Organisaation käyttäytyminen ja ihmisen päätöksentekoprosessit, 62, 252-266.

Green, P. E., & amp; Srinivas an, V. (1990). Yhteisanalyysi markkinoinnissa: Uutta kehitystä, joka vaikuttaa tutkimukseen ja käytäntöön. Journal of Marketing, 45, 33-41.

Green, P. E., & amp. Wind, Y. (1973). Multiattribute -päätökset markkinoinnissa: Mittausmenetelmä. Hinsdale, IL: Dryden Press.

Hoffman, P. J. (1960). Kliinisen arvioinnin paramorfinen esitys. Psykologinen tiedote, 57, 116-131.

Hsee, C. K. (1996). Arvioitavuushypoteesi: Selitys vaihtoehtojen yhteisen ja erillisen arvioinnin välisistä mieltymysten muutoksista. Organisaation käyttäytyminen ja ihmisen päätöksentekoprosessit, 46, 247-257.

Jones-Lee, M. W., Loomes, G., & amp; Philips, P. R. (1995). Ei-kuolemaan johtavien liikennevammojen ehkäisemisen arvostaminen: ehdollinen arvostus vs. tavalliset uhkapelit. Oxfordin talouspaperit, 47, 676 ym.

Keeney, R. L. (1992). Arvokeskeinen ajattelu: polku luovaan päätöksentekoon. Cambridge, MA: Harvard University Press.

Keeney, R. L., & amp; Raiffa, H. (1993). Päätökset, joilla on useita tavoitteita. New York: Cambridge University Press (alunperin julkaisija Wiley, 1976).

Louviere, J. J. (1988). Yksilöllisen päätöksenteon analysointi: Metrinen yhteinen analyysi. Newbury Park, Kalifornia: Sage.

Lynch, J. G., Jr., Chakravarti, D., & amp; Mitra, A. (1991). Kontrastivaikutukset kuluttaja -arvioinneissa: Muutokset arviointiasteikon ankkuroinnissa. Journal of Consumer Research, 18, 284-297.

Mellers, B. A., & amp Cooke, A. D. J. (1994). Kompromissit riippuvat ominaisuuksien alueesta. Journal of Experimental Psychology: Human Perception and Performance, 20, 1055-1067.

Tversky, A., & amp; Kahneman, D. (1981). Päätösten muotoilu ja valinnan psykologia. Tiede, 211, 453-458.

Ubel, P. A., Loewenstein, G., Scanlon, D., & amp. Kamlet, M. (1996). Yksittäiset apuohjelmat ovat ristiriidassa annosteluvalintojen kanssa: Osittainen selitys siitä, miksi Oregonin kustannustehokkuusluettelo epäonnistui. Lääketieteellinen päätöksenteko, 16, 108-116.

von Winterfeldt, D., & amp; Edwards, W. (1986). Päätösanalyysi ja käyttäytymistutkimus. Cambridge University Press.

Weber, M., & amp; Borcherding, K. (1993). Käyttäytymisvaikutukset painopäätöksiin monen jaon päätöksenteossa. European Journal of Operations Research, 67, 1-12.

Alaviitteet:

1 Tätä tutkimusta tukee N.S.F. apuraha SBR95-20288 ja Pennsylvanian yliopiston syöpäkeskuksen apuraha.

Tiedosto on käännetty kielestä T E X kirjoittanut: T. T H, versio 2.20.
3. heinäkuuta 1999, klo 16.35.


5. Aspiraatiomittauksen käytettävyyden, luotettavuuden ja pätevyyden testaus

Tässä osassa esitetään empiirinen strategia, jolla testataan ehdotettujen välineiden riittävyyttä pyrkimysten mittaamiseen. Erityisesti välineistöä arvioitiin seuraavasti: Tätä tarkoitusta varten toteutettiin tarkoituksella suunniteltu pilottitutkimus 16 Etiopian keskiosan kylässä, jotka oli koottu Debre Berhanin kaupungin ympärille. Otokseen valitut henkilöt olivat kaikki kotitalouksien jäseniä, joita haastateltiin toistuvasti Etiopian maaseudun kotitaloustutkimuksessa (ERHS) viimeisten 20 vuoden aikana. ERHS -tietojen käyttö mahdollisti tarkoituksenmukaisen otannan eri sukupuolten, koulutustasojen ja ikäryhmien yksilöistä. Tätä tarkoitusta varten rakensimme 60 otosluokkaa yksilöitä, joista jokainen on ainutlaatuinen yhdistelmä eri koulutustasoja (5 tasoa), sukupuolta (2 tasoa) ja ikää (6 tasoa).Valitsimme kustakin kylästä yksilöitä, joille löysimme vähintään kaksi samaan luokkaan kuuluvaa yksilöä ERHS -näytteestä. Jokaisen valitun yksilön osalta otoksessamme on siis vähintään yksi saman kylän asukas, joka kuuluu samaan ikäryhmään, jolla on samanlainen koulutustaso ja samaa sukupuolta. Kaiken kaikkiaan kysely kattoi 170 yksilöä 16 kylässä, tai puuttuvia tietoja tietyistä muuttujista tarkoittaa, että vain 155 havaintoa voidaan käyttää tehokkaasti kaikissa alla olevissa testeissä lukuun ottamatta ankkurointitestia, jossa 20 vastaajaa kieltäytyi keskustelemasta vertaistason tavoitteista.

Käytettävyys: Voidaanko sitä hallinnoida vakiotutkimuksissa? Ovatko vastaajat valmiita vastaamaan tällaisiin kysymyksiin?

Luotettavuus: Voidaanko luottaa johdonmukaisten pyrkimysten mittaamiseen toistuvissa sovelluksissa? Missä määrin saadut vastaukset riippuvat laskentakapasiteetista ja/tai kyselylomakkeesta?

Voimassaolo: Mittaako se tehokkaasti toiveita ja vain toiveita? Ovatko saadut vastaukset toiveiden ja vastaavan tulevaisuuteen suuntautuvan käyttäytymisen odotettavissa olevien tekijöiden mukaisia? Miten kokonaisindikaattori toimii verrattuna yhden ulottuvuuden indikaattoreihin? Pitäisikö aggregointiprosessissa käyttää yksilöllistä painotusjärjestelmää?

Toistettavuus: Miten se onnistuu muissa yhteyksissä? Ovatko tässä löydetyt tulokset yhdenmukaisia ​​muualla samankaltaisia ​​mittauksia käyttävien tulosten kanssa?

Kyselylomake oli lyhyt ja suunniteltu ainoastaan ​​tätä pyrkimystoimenpiteiden kokeiluarviointia varten. Se sisälsi edellä kuvatut pyrkimyksiin liittyvät kysymykset, jotka kattoivat neljä ulottuvuutta: vuositulot, vauraus (tuottamattomien varojen osalta), koulutus ja sosiaalinen asema yhteisössä-jälkimmäisen ottaa huomioon kylän yksilöiden osuus neuvoja ennen kuin teet tärkeän päätöksen. Kuvassa 1 esitetään käytetyn aspiraatiomoduulin asettelu. Nämä kysymykset esitettiin vastaajille itselleen ja vertaisilleen, jotka määriteltiin toiseksi henkilöksi samassa kylässä, jolla on samanlaiset ikä-, sukupuoli- ja koulutusominaisuudet.


Achen, Christopher H. (1975). "Joukkopoliittiset asenteet ja kyselyvastaus."American Political Science Review 69:1218–31.

Backstrom, Charles H. ja Gerald Hursh-Cesar (1981).Kysely tutkimus. New York: Wiley.

Bem, Daryl J. (1978). "Itsetuntoteoria." Julkaisussa Leonard Berkowitz, toim.Kognitiiviset teoriat sosiaalipsykologiassa. New York: Academic Press.

Piispa, George F., Robert W. Oldendick ja Alfred J. Tuchfarber (1978). "Muutos amerikkalaisten poliittisten asenteiden rakenteessa: kysymyksen sanamuoto."American Journal of Political Science 22:250–69.

Poliittisten opintojen keskus (1972).CPS 1970 American National Election Study. Ann Arbor, Mich .: Yliopistojen välinen poliittisen tutkimuksen konsortio, Michiganin yliopisto.

—— (1977).CPS 1976 American National Election Study: Volume II. Ann Arbor, Mich .: Yliopistojen välinen poliittisen ja sosiaalisen tutkimuksen yhteenliittymä, Michiganin yliopisto.

—— (1979).American National Election Study, 1978: osa II. Ann Arbor, Mich .: Yliopistojen välinen poliittisen ja sosiaalisen tutkimuksen yhteenliittymä, Michiganin yliopisto.

Converse, Philip E. (1970). "Asenteet ja ei-asenteet: vuoropuhelun jatkaminen." Pp. 168–189, julkaisussa Edward R. Tufte, toim.Sosiaalisten ongelmien kvantitatiivinen analyysi. Lukeminen, massa: Addison-Wesley.

Davis, James A. (1974). "Hierarkiset mallit merkittävyystesteille monimuuttujataulukoissa." Pp. 189–231, julkaisussa Herbert L.Costner, toim.Sosiologinen metodologia 1973–1974. San Francisco: Jossey-Bass.

Erbring, Lutz, Edie N. Goldenberg ja Arthur H.Miller (1980). "Etusivun uutiset ja tosielämän vihjeet: Median uusi näkemys esityslistan asettamisesta."American Journal of Political Science 24:16–49.

Lodge, Milton ja Bernard Tursky (1979). "Vertailu SRC/CPS -kohteita käyttävien poliittisten mielipiteiden luokkien ja suuruusluokkien välillä."American Political Science Review 73:50–66.

Loftus, Geoffrey R. ja Elizabeth F.Loftus (1976).Ihmisen muisti: Tietojen käsittely. New York: Wiley.

Margolis, Michael (1977). "Hämmennyksestä hämmennykseen: ongelmat ja amerikkalainen äänestäjä, 1956–1972."American Political Science Review 71:31–43.

Miller, Warren E., Arthur H. Miller ja Edward J. Schneider (1980).American National Election Studies Data Sourcebook, 1952–1978. Cambridge: Harvard University Press.

Nie, Norman N., Sidney Verba ja Joan R.Petrocik (1979).Muuttuva amerikkalainen äänestäjä. Cambridge, Massa .: Harvard University Press.

Nisbett, Richard ja Lee Ross (1980).Inhimillinen vaikutus: sosiaalisen tuomion strategioita ja puutteita. Englewood Cliffs, NJ: Prentice-Hall.

Page, Benjamin, I. ja Calvin C. Jones (1979). "Poliittisten mieltymysten, puolueiden uskollisuuksien ja äänestyksen vastavuoroiset vaikutukset."American Political Science Review 73:1071–89.

Shaw, Donald L. ja Maxwell E.McCombs (1977).Amerikan poliittisten kysymysten syntyminen: Lehdistön esityslistan asetus. Paul, Minn .: West Publishing Co.

Smith, Eric R.A.N. (1980). "Käsitteellistymisen tasot: ideologisen hienostuneisuuden vääriä mittauksia."American Political Science Review 74:685–96.

Smith, Tom W. (1981). "Voimmeko luottaa luottamukseen? Käytiin uudelleen. ” Julkaisussa Denis F.Johnston, toim.Alistuvien ilmiöiden mittaus. Washington, DC: Yhdysvaltain hallituksen painotoimisto.

Sudman, Seymour ja Norman M.Bradburn (1974).Response Effects in Surveys: Katsaus ja yhteenveto, Chicago: Aldine.

Sullivan, John L., James E.Piereson ja George E.Marcus (1978). "Ideologinen rajoitus yleisössä: metodologinen kritiikki ja joitain uusia havaintoja."American Journal of Political Science 22:233–49.

- (1979). "Vaihtoehtoinen poliittisen suvaitsevaisuuden käsite: kuvitteelliset lisäykset, 1950--1970-luvut."American Political Science Review 73:781–94.

Survey Research Center (1971).Survey Research Center 1958 -vaalitutkimus. Ann Arbor, Mich .: Yhteiskuntatutkimuslaitos, Michiganin yliopisto.

Taylor, Shelley E. ja Susan T.Fiske (1978). "Merkityksellisyys, huomio ja vaikuttavuus: huippuilmiöitä." Pp. 249–288, julkaisussa Leonard Berkowitz, toim.Advances in Experimental Social Psychology, Voi. II. New York: Academic Press.

Turner, Charles F. ja Elissa Krauss (1978). "Kansan subjektiivisen tilan virheelliset indikaattorit."Amerikkalainen psykologi 33:456–470.


Kiitokset

Tutkimuksen 1 tiedot saatiin Joint Advertising, Market Research & amp Studies (JAMRS) -ohjelmasta. Tämän artikkelin näkemykset, mielipiteet ja havainnot ovat yksinomaan kirjoittajien näkemyksiä, eikä niitä tule tulkita Yhdysvaltain puolustusministeriön viralliseksi kannaksi, politiikaksi tai päätökseksi, ellei toisin ole mainittu muissa asiakirjoissa. Osia tästä asiakirjasta esiteltiin teollisen ja organisaatiopsykologian yhdistyksen vuoden 2010 vuosikokouksessa, Chicago, IL. Kirjoittajat haluavat kiittää M. Gloria Gonzalez-Moralesia hänen avustaan ​​tämän hankkeen aiemmissa versioissa. Kirjoittajat haluavat myös kiittää Samantha Baardia hänen avustaan ​​tutkimuksen 2 verkkokyselyn ohjelmoinnissa.


Kyselyn muotoilu

Tehokkaiden kohteiden kirjoittaminen on vain yksi osa kyselyn rakentamista. Ensinnäkin jokaisessa kyselyssä tulisi olla kirjallinen tai suullinen johdanto, joka palvelee kahta perustoimintoa (Peterson, 2000) [10]. Yksi on kannustaa vastaajia osallistumaan kyselyyn. Monissa tutkimustyypeissä tällaista rohkaisua ei tarvita, koska osallistujat eivät tiedä olevansa tutkimuksessa (kuten naturalistisessa havainnossa) tai koska he ovat osa aihepiiriä ja ovat jo osoittaneet halukkuutensa osallistua rekisteröitymällä ja näyttämällä opiskelemaan. Yleensä kyselytutkimus yllättää vastaajat, kun he vastaavat puhelimeensa, menevät postilaatikkoonsa tai tarkistavat sähköpostinsa-ja tutkijan on perusteltava, miksi heidän pitäisi suostua osallistumaan. Näin ollen johdannossa tulisi lyhyesti selittää tutkimuksen tarkoitus ja sen merkitys, antaa tietoa kyselyn sponsorista (yliopistopohjaiset kyselyt tuottavat yleensä korkeampia vastausprosentteja), tunnustaa vastaajan osallistumisen tärkeys ja kuvata mahdolliset osallistumisen kannustimet .

Johdannon toinen tehtävä on saada tietoinen suostumus. Muista, että tähän kuuluu kuvata vastaajille kaikki, mikä saattaa vaikuttaa heidän päätökseen osallistua. Tämä sisältää kyselyn kattamat aiheet, sen todennäköisesti kuluvan ajan, vastaajan mahdollisuuden vetäytyä milloin tahansa, luottamuksellisuusongelmat jne. Kirjallisia suostumuslomakkeita ei aina käytetä kyselytutkimuksessa (kun tutkimuksella on minimaalinen riski ja IRB hyväksyy usein kyselyvälineen valmistumisen todisteeksi osallistumisesta), joten on tärkeää, että tämä osa johdannosta on hyvä joka on dokumentoitu ja esitetty selkeästi ja kokonaisuudessaan jokaiselle vastaajalle.

Johdannon jälkeen on esitettävä olennaiset kyselylomakkeet. Mutta ensin on tärkeää esittää selkeät ohjeet kyselylomakkeen täyttämiseen, mukaan lukien esimerkkejä epätavallisten vastausasteikkojen käytöstä. Muista, että johdanto on kohta, jossa vastaajat ovat yleensä eniten kiinnostuneita ja vähiten väsyneitä, joten on hyvä käytäntö aloittaa tutkimuksen kannalta tärkeimmistä kohteista ja siirtyä vähemmän tärkeisiin kohteisiin. Kohteet tulee myös ryhmitellä aiheen tai tyypin mukaan. Esimerkiksi kohteet, jotka käyttävät samaa luokitusasteikkoa (esim. 5-pisteinen sopimusasteikko), olisi ryhmiteltävä yhteen, jos mahdollista, jotta asiat olisivat nopeampia ja helpompia vastaajille. Väestötiedot esitetään usein viimeisenä, koska ne ovat vähiten kiinnostavia osallistujille, mutta myös helppo vastata, jos vastaajat ovat väsyneet tai kyllästyneet. Tietenkin minkä tahansa kyselyn pitäisi päättyä ilmaisemalla kiitollisuutta vastaajalle.

  1. Sudman, S., Bradburn, N. M., & amp; Schwarz, N. (1996). Vastausten pohtiminen: Kognitiivisten prosessien soveltaminen kyselyn menetelmiin. San Francisco, CA: Jossey-Bass. & crarr
  2. Chang, L., & amp; Krosnick, J.A. (2003). Säännöllisen käyttäytymisen taajuuden mittaaminen: "Tyypillisen viikon" vertaaminen "viimeiseen viikkoon". Sosiologinen metodologia, 33, 55-80. & crarr
  3. Schwarz, N., & amp Strack, F. (1990). Kontekstivaikutukset asennetutkimuksissa: Kognitiivisen teorian soveltaminen sosiaaliseen tutkimukseen. Teoksissa W.Stroebe & amp.Hewstone (toim.), Sosiaalipsykologian eurooppalainen katsaus (Vuosikerta 2, s. 31–50). Chichester, Iso -Britannia: Wiley. & crarr
  4. Strack, F., Martin, L. L., & amp; Schwarz, N. (1988). Aloitus ja viestintä: Tietojen yhteiskunnalliset tekijät, jotka käyttävät tietoa elämän tyytyväisyyden arviointiin. European Journal of Social Psychology, 18, 429–442. & crarr
  5. Schwarz, N. (1999). Itseraportit: Kuinka kysymykset muokkaavat vastauksia. Amerikkalainen psykologi, 54, 93–105. & crarr
  6. Miller, J.M. & amp; Krosnick, J.A. (1998). Ehdokkaiden nimijärjestyksen vaikutus vaalituloksiin. Julkinen mielipide neljännesvuosittain, 62(3), 291-330. & crarr
  7. Krosnick, J.A. & amp; Berent, M.K. (1993). Puolueiden tunnistamisen ja toimintatapojen vertailut: Kyselyn kysymysmuodon vaikutus. American Journal of Political Science, 27(3), 941-964. & crarr
  8. Likert, R. (1932). Tekniikka asenteiden mittaamiseen. Psykologian arkisto, 140, 1–55. & crarr
  9. Peterson, R.A. (2000). Tehokkaiden kyselylomakkeiden luominen. Thousand Oaks, CA: Salvia. & crarr
  10. Peterson, R.A. (2000). Tehokkaiden kyselylomakkeiden luominen. Thousand Oaks, CA: Salvia. & crarr

Tahattomat vaikutukset vastaajien vastauksiin, koska ne eivät liity kohteen sisältöön vaan kontekstiin, jossa kohde esiintyy.

Kun kohteiden esitysjärjestys vaikuttaa ihmisten vastauksiin.

Kysy vain kysymys ja anna osallistujien vastata haluamallasi tavalla.

Kyselylomakkeet, jotka esittävät kysymyksen ja tarjoavat osallistujille rajoitetun valikoiman vastausvaihtoehtoja.

Järjestetty vastausjoukko, josta osallistujien on valittava.

Lyhenne, joka tarkoittaa "lyhyt", "relevantti", "yksiselitteinen", "erityinen" ja "objektiivinen", jota käytetään luomaan tehokkaita lyhyitä ja ytimekkäitä kyselylomakkeita.


Psykologinen "itsensä ja muiden päällekkäisyys" ja tuki orjuuden korvauksille

Neurobiologiset ja sosiaalipsykologiset tutkimukset viittaavat siihen, että on olemassa tiedostamaton "itsensä ja muiden päällekkäisyyksien" olemassaolo, joka voi johtaa yksilöihin samaistumaan muihin yksilöihin tai ryhmiin. Tässä asiakirjassa tutkitaan, voisiko tämä vaikutus auttaa selittämään joidenkin valkoisten tuen muuten epäsuositulle politiikalle afroamerikkalaisten orjuuden korvausten puolesta. Edustava puhelinkysely (n = 1200) toimii vertailun lähtökohtana online-reaktioaikatutkimuksessa, jossa ei ole edustava näyte (n = 1341), joka mittaa "itsensä ja muiden päällekkäisyyksiä" (viitaten "epäsuoraan läheisyyteen" mustien kanssa). Osittaiset suhteelliset kertoimet tilatut logit -analyysit paljastavat implisiittisen läheisyyden mustien kanssa valkoisten vastaajien keskuudessa tehokkaimpana hyvitysten ennustajana. Epäsuoran läheisyyden absoluuttisen vaikutuksen suuruus ylittää perinteisten ennustajien, kuten rodun kauna, ideologia ja puolueiden tunnistaminen. Keskustellaan metodologisista ja poliittisista vaikutuksista.


Pääsyvaihtoehdot

Osta yksi artikkeli

Välitön pääsy koko artikkeliin PDF.

Veron laskenta viimeistellään kassalla.

Tilaa päiväkirja

Välitön pääsy kaikkiin numeroihin vuodesta 2019 alkaen. Tilaus uusitaan automaattisesti vuosittain.

Veron laskenta viimeistellään kassalla.


Arviointikysymys: Asenteiden mittausmenetelmä ☆

Tässä artikkelissa esitetään EQA (Evaluation Question Approach), jolla voidaan mitata asennetta sosiaalisiin ja taloudellisiin kysymyksiin kognitiivisen arvioinnin puitteissa. EQA: n perusajatus on, että vastaajalle tarjotaan sanallisia arviointitarroja, jotka sitten yhdistävät kyseessä olevan kohteen kuvauksen tai ilmentymän. Sen sijaan, että se toimittaisi ärsykkeitä vastaaville tunteille, kuten psykofyysisiä menetelmiä käytettäessä, tarkasteltava lähestymistapa toimii päinvastoin. Sitä voidaan pitää vastakohtana vinjettitekniikalle, jolla metodologisesti perustuva vertailu tehdään. Sanallisia tarroja tutkitaan, jos eri vastaajat tulkitsevat niitä muuten. Tätä tärkeää skaalausongelmaa sovelletaan vuoden 1983 Bostonin (USA) tietojoukkoon, jossa on noin 500 vastaajaa. Tämän empiirisen testin tulos tukee oletusta, että tulkintaeroja ei ole. Yhteenvetona voidaan todeta, että EQA näyttää olevan elinkelpoinen yleinen menetelmä, ja sitä voidaan soveltaa useisiin aiheisiin kaikissa käyttäytymistieteissä.

Kirjoittajat haluavat ilmaista kiitollisuutensa Steven Dubnoffille, Massachusettsin yliopistosta Bostonista, joka loi tietojoukon National Science Foundationin taloudellisella tuella. He haluavat myös kiittää kahta anonyymiä erotuomaria arvokkaista näkemyksistään. Tekijät ovat luonnollisesti vastuussa kaikista jäljellä olevista virheistä ja ilmaisemista mielipiteistä.


Katso video: Vaaliehdokas oksentaa suuhunsa (Elokuu 2022).