Vis enkel innførsel

dc.contributor.advisorYazidi, Anis
dc.contributor.advisorArntzen, Erik
dc.contributor.authorMofrad, Asieh Abolpoue
dc.date.accessioned2021-02-24T08:33:12Z
dc.date.available2021-02-24T08:33:12Z
dc.date.issued2021
dc.identifier.isbn978-82-8364-282-7
dc.identifier.isbn978-82-8364-292-6
dc.identifier.issn2535-5414
dc.identifier.urihttps://hdl.handle.net/10642/9707
dc.description.abstractIn this thesis, two well studied subjects in behavior analysis are computationally modeled; formation of stimulus equivalence classes, and adaptive learning. The former is addressed in Study I and Study II, while the latter is addressed in Study III and Study IV. Background. Stimulus equivalence as a behavioral analytic approach studies cognitive skills such as memory and learning. Despite its importance in experimental studies, from a computational modelling point of view, the formation of stimulus equivalence classes has largely been under-investigated. On the other hand, adaptive learning in a broad sense, is a tool to study several cognitive tasks including memory and remembering. An appropriate model can be used as a cognitive level finder, and as a recommendation tool to optimize the training and learning sequence of tasks. Aims. To propose computational models that replicate formation of stimulus equivalence classes and adaptive learning. The models are supposed to be simple, flexible and interpretable in order to be suitable for analysis of human complex behavior. Methods. Agents endowed with Reinforcement learning, more precisely Projective Simulation and Stochastic Point Location, are used to model the interaction between experimenter and the participant through the testing/learning process. Formation of derived relations in Study I is achieved by on demand computation during the test phase trials using likelihood reasoning. In Study II, subsequent to the training phase, an iterative diffusion process called Network Enhancement is used to form derived relations, which turns the test phase into a memory retrieval phase. The solution to Stochastic Point Location in Study III aims to estimate the tolerable task difficulty level in an online and interactive settings. In Study IV, the appropriate task difficulty for training and learning is sought by using a target success rate that is usually defined beforehand by the experimenter using a method called Balanced Difficulty Task Finder. Results. The proposed models for replication of equivalence relations, called Equivalence Projective Simulation (Study I) and Enhanced Equivalence Projective Simulation (Study II) could replicate a variety of settings in a matching-to-sample procedure. The models are quite flexible and appropriate to replicate results from real experiments and simulate different scenarios before performing an empirical experiment involving human subjects. In Study III, we suggest a new method to estimate the unknown point location in the Stochastic Point Location problem domain using the mutual probability flux concept and we prove that the proposed solution outperforms the legacy solution reported in the literature. The probability of receiving correct response from the participant is also estimated as a measure of reliability of participant's performance. In Study IV, we propose a model that is able to suggest a manageable difficulty level to a learner based on online feedback via an asymmetric adjustment technique of difficulty. Discussion. We aimed for models that are flexible, interpretative without a need of extensive pre-training of the model. By resorting to the theory of Projective Simulation, we propose an interpretable simulator for equivalence relations that enjoys the advantage of being easy to configure. By virtue of the Stochastic Point Location model, it is possible to eliminate the need for prior-knowledge about the participant while also avoiding complex modelling techniques. Although not pursued in this thesis, those two lines of modelling could be used in a complementary setting. For instance, adaptive learning can be integrated in the training phase of matching-to-sample or titrated delayed matching-to-sample procedures as suggested in Study IV.en
dc.description.abstractI denne oppgaven er velstuderte emner i atferdsanalyse modellert ved bruk av beregningsmodeller; formasjon av stimulusekvivalensklasser, og adaptiv læring. Det første er diskutert i Studie I og Studie II, og det andre i Studie III og Studie IV. Bakgrunn. Stimulusekvivalens som en atferdsanalytisk tilnærming studerer kognitive ferdigheter som hukommelse og læring. Til tross for sin viktighet i eksperimentelle studier sett fra beregnings og modelleringsperspektivet, har formasjonen av stimulusekvivalensklasser i hovedsakelig vært lite forsket på. På en annen side, adaptiv læring, i vid forstand, er et verktøy for å studere flere kognitive funksjoner, inkludert hukommelse og evne til å huske. En passende modell kan brukes for å finne kognitivt nivå, og som et anbefalingsverktøy for optimalisering av oppgaverssekvenser for trening og læring. Mål. Å foreslå beregningsmodeller som er i stand til å replisere formasjon av stimulusekvivalensklasser og adaptiv læring. Modellene forventes å være enkle, fleksible og tolkbare for å være godt egnet til analysering av menneskelig komplisert atferd. Metoder. Agenter utstyrt med forsterkende læring, mer presist projektiv simulering og stokastisk punktlokalisering, er brukt til å modellere samhandling mellom eksperimentator og forsøkspersonen gjennom en prøving og læringsprosess. Formasjonen av deriverte relasjoner i Studie I er oppnådd ved behovsbasert beregning under prøveforsøksfasen ved bruk av sannsynlighetsresonnementer. I Studie II, etter treningsfasen, en iterative diffusjonsprosess kalt nettverkforbedring er brukt til å danne deriverte relasjoner, som omgjør testfasen til en fase for gjenvinning av hukommelse. Stokastisk punktlokalisering i Studie III tar sikte på vurdering av passende vanskelighetsnivå i et interaktivt miljø i reell tid. I Studie IV, søkes passende vanskelighetsgrad på oppgavene ved prøving og læring ved å bruke en viss suksessrate og som vanligvis er definert av eksperimentatoren på forhånd ved bruk av en metode kalt Balanced Difficulty Task Finder. Resultater. Foreslåtte modeller for replikasjoner av ekvivalensrelasjoner, som kalles ekvivalens projektiv simulering (Studie I) og forbedret ekvivalens projektiv simulering (Studie II) kan replikere en rekke ulike matching-to-sample-prosedyrer. Modellene er helt fleksible og passende for å replikere resultater fra ekte eksperimenter og simulere ulike scenarioer før gjennomføring av empiriske eksperimenter med mennesker. I Studie III, foreslår vi en ny metode for å vurdere den ukjente posisjonen i stokastisk punktlokaliserings problemdomen ved bruk av konseptet kalt mutual probability flux og vi beviser at vår foreslåtte løsning utkonkurrerer andre løsninger rapportert i litteraturen. Sannsynligheten for å få korrekte responser fra forsøkspersonen er også vurdert som et pålitelighetsmål til forsøkspersonens gjennomføring. I Studie IV, foreslår vi en modell som anbefaler et passende vanskelighetsnivå for en bruker basert på umiddelbare tilbakemeldingen og justering av vanskelighetsgrad gjennom en teknikk kalt asymmetric adjustment. Diskusjon. Vårt mål var å lage modeller som er fleksible, fortolkende uten behov for forhåndstrening av modellen. Ved bruk av projektiv simuleringteori, foreslår vi en tolkningsmulig simulator for ekvivalensrelasjoner som i tillegg enkelt kan konfigureres. Ved å bruke Stokastisk punktlokaliseringsmodellen elimineres behovet for tidligere kunnskap om forsøkspersonen og samtidig unngås behovet for kompleks modellering. Selv om at det er ikke fulgt i denne oppgaven, kan disse to retningene for modellering bli brukt i et kompletterende miljø. For eksempel, adaptiv læring kunne bli innlemmet i treningsfasen av matching-to-sample eller titrert forsinket matching-to-sample-prosedyrer, og som er foreslått i Studie IV.en
dc.language.isoenen
dc.publisherOsloMet - Storbyuniversiteteten
dc.publisherOsloMet - Oslo Metropolitan Universityen
dc.relation.ispartofseriesOsloMet Avhandling 2021;Nr 3
dc.rightsAttribution-ShareAlike 3.0 United Statesen
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/us/*
dc.subjectVDP::Samfunnsvitenskap: 200::Psykologi: 260en
dc.subjectVDP::Matematikk og Naturvitenskap: 400::Informasjons- og kommunikasjonsvitenskap: 420::Simulering, visualisering, signalbehandling, bildeanalyse: 429en
dc.subjectVDP::Teknologi: 500::Informasjons- og kommunikasjonsteknologi: 550en
dc.subjectHuman complex behavioren
dc.subjectStimulus equivalence classesen
dc.subjectArbitrary matching-to-sampleen
dc.subjectTitrated delayed matching-to-sampleen
dc.subjectArtificial intelligenceen
dc.subjectReinforcement learningen
dc.subjectAdaptive learningen
dc.subjectStochastic point locationsen
dc.subjectKompleks menneskelig atferden
dc.subjectStimulusekvivalensklasseren
dc.subjectArbitrær matching-to-sampleen
dc.subjectTitrert forsinket matching-to-sampleen
dc.subjectKunstig intelligensen
dc.subjectAdaptiv læringen
dc.subjectStokastisk punktlokaliseringen
dc.titleWhen Behavior Analysis Meets Machine Learning; Formation of Stimulus Equivalence Classes and Adaptive Learning in Artificial Agentsen
dc.typeDoctoral thesisen
dc.typePeer revieweden
dc.description.versionpublishedVersionen


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel

Attribution-ShareAlike 3.0 United States
Med mindre annet er angitt, så er denne innførselen lisensiert som Attribution-ShareAlike 3.0 United States