Neuraalne andmeteadus: kuidas ja miks

Töötlemata juhend neuronite andmete teaduse tegemiseks

Aju, mis tegeleb andmeteadusega. Autor: Matt Wasser aju nimestikprojektist

Vaikselt, salakavalalt on kujunemas uut tüüpi neuroteadlased. Teoreetikute hulgast on tõusnud neuroteadlaste meeskonnad, kes tegelevad teadmistega närvide aktiivsuse kohta sadade neuronite hõredal plahvatusel. Mitte andmete analüüsimeetodite loomine, ehkki ka kõik teevad seda. Nende andmete kogumine ei vaja, sest selleks on vaja uut, valusat oskuste kogumit. Kuid neuroteadlased, kes kasutavad aju kohta teaduslikele küsimustele vastamiseks nende andmete jaoks kõiki kaasaegseid arvutustehnikaid. Tekkinud on neuraalne andmeteadus.

Selgub, et ma olen üks neist, see närvide andmeteadlaste klann. Juhuslikult. Niipalju kui ma oskan öelda, sünnivad kõik teadusvaldkonnad juhuslikult. Teadlased järgivad nina, hakkavad tegema uusi asju ja leiavad ootamatult, et pidude ajal on köögis väike rahvahulk (sest seal joogid asuvad, külmkapis - teadlased on nutikad). Nii et siin on väike manifest närvandmete teadusele: miks see ilmneb ja kuidas me võiksime seda teha.

Miks on sama mis kõigil teaduse valdkondadel, mis on välja lasknud andmeteadused: andmete hulk läheb käest. Paljude neuronite registreerimise teaduse jaoks on sellel andmestikul mitmesuguseid teaduslikke põhjuseid. Ajud töötavad neuronite vahel sõnumite edastamise teel. Enamik neist teadetest on pisikeste elektriimpulsside kujul: naelu, me kutsume neid. Nii tundub paljudele loogiline, et kui tahame aru saada, kuidas ajud töötavad (ja kui need ei tööta), peame hõlmama kõik neuronite vahel edastatavad sõnumid. Ja see tähendab, et registreeritakse võimalikult palju naelu võimalikult paljudest neuronitest.

Imiku sebrakala ajus on umbes 130 000 neuroni ja nende vahel vähemalt 1 miljon ühendust; kimalase ajus on umbes miljon neuroni. Näete, kuidas see väga kiiresti käest ära läheks. Praegu salvestame standardkomplektiga kuskil kümnete kuni mõnesaja neuroni vahel. Piirides on inimesi, kes registreerivad mõnd tuhat ja isegi mõnikümmend tuhat (ehkki need salvestused löövad neuronite aktiivsust palju aeglasemalt, kui neuronid võiksid oma naelu saata).

Me kutsume seda hullumeelsussüsteeme neuroteaduseks: neuroteaduseks, neuronite uurimiseks; süsteemid, et julgeda salvestada rohkem kui ühest neuronist korraga. Ja andmed on kergelt keerukad. See, mis meil on, on kümneid tuhandeid samaaegselt salvestatud aegridasid, iga voog ühe neuroni spikkerimisürituste (tegelikud naelu või nende kaudse mõõtme) voog. Definitsiooni järgi ei ole nad paigal, nende statistika muutub aja jooksul. Nende aktiivsuse määr jagunes paljudesse suurusjärkudesse, alates mungalaadsetest vaiksetest mõtisklemistest kuni "trummikomplektiga tuuletunnelis". Ja nende tegevusharjumused ulatuvad kellakujulisest regulaarsusest, nokitsemisest ja pritsimisest kuni vaheldumisi maania ja kurnatuse löögini välja.

Nüüd abielluge selle looma käitumisega, kellelt olete neuronid registreerinud. See käitumine on sadu valikute katsumusi; või käe liigutused; või keskkonna kaudu läbitud marsruute. Või meeleelundi liikumine või kogu lihaskonna kehahoiak. Korda mitu looma. Võimalik, et mitu ajupiirkonda. Ja mõnikord terved ajud.

Meil pole alustõde. Pole õiget vastust; andmete jaoks pole treeningsilte, välja arvatud käitumine. Me ei tea, kuidas ajud käitumist kodeerivad. Nii et me saame asju käitumismärkidega teha, kuid teame peaaegu alati, et need ei ole vastus. Need on lihtsalt vihjed vastusele.

Süsteemne neuroteadus on siis rikkalik mänguväljak neile, kes saavad oma teadmiste neuroteadmiste abil andmete analüüsimiseks abielluda. Sünnib neuraalne andmeteadus.

Kuidas seda tehakse - või võiks seda teha? Siin on umbkaudne juhend. Neuraalandmeteadlase põhjendus on küsida süsteemneuroteaduste andmete teaduslikke küsimusi; küsida: kuidas kõik need neuronid koos töötavad, et oma asja teha?

Sellele küsimusele saab vastata umbes kolmel viisil. Neid kolme viisi näeme, kui uurime masinõppe väljakujunenud probleemiklasside ja süsteemneuroteaduste arvutuslike väljakutsete vastavust. Alustame lähemalt sellest, millega peame koostööd tegema.

Meil on n neuroni kohta andmeid, mida oleme aja jooksul kogunud. Me koondame need maatriksiks, mida me kutsume X - nii palju veerge kui neuroneid ja nii palju ridasid kui ajapunkte, mille oleme registreerinud (kui meist sõltub, kui kaua "ajapunkt" kestab: me võiksime muutke see lühikeseks ja pange iga kande jaoks teraviku jaoks 1 ja muul juhul 0. Kui võtame, siis võib selle pikkuseks teha ja iga kanne registreerib kogu selle aja jooksul tekkinud naelu arvu). Selle aja jooksul on maailmas juhtunud asju - sealhulgas ka seda, mida keha on teinud. Pangem see kõik maatriksiks, mida me kutsume S-ks - nii palju veerge, kui maailmas on funktsioone, millest me hoolime, ja nii palju ridu kui ajahetke, mille oleme nende funktsioonide jaoks salvestanud.

Traditsiooniliselt hõlmab masinõpe maailma olekut ja olemasolevaid andmeid käsitleva kolme mudeli moodustamist: generatiivne, diskrimineeriv ja tihedus. Ligikaudse juhisena näitab see tabel, kuidas iga klass vastab süsteemide neuroteaduse põhiküsimusele:

1 / Tihedusmudelid P (X): kas naelu struktuur on olemas? Kõlab igavalt. Kuid tegelikult on see võti neuroteaduste uurimise suureks osaks, milles tahame teada millegi (ravim, käitumine, uni) mõju ajule; milles küsime: kuidas on närvitegevuse struktuur muutunud?

Salvestades hunniku neurone, saame sellele vastata kolmel viisil.

Esiteks saame kvantifitseerida iga neuroni teravnurga, mõõtes iga X veeru statistika, nagu näiteks spikeerimise kiirus. Ja siis küsige: mis on selle statistika mudel P (X)? Saame selle statistika rühmitada, et leida neuronite tüübid; või sobivad mudelid lihtsalt kogu nende ühisele jaotusele. Mõlemal juhul on meil üksikute neuronite detailsuse andmestruktuuri mudel.

Teiseks saame luua generatiivseid mudeleid kogu populatsiooni aktiivsusest, kasutades X-i ridu - kogu populatsiooni hetk-aktiivsuse vektorid. Selliste mudelite eesmärk on tavaliselt mõista, kui suurt osa X-i struktuurist saab taastada vaid mõne piirangu põhjal, olgu need siis jaotused selle järgi, kui paljudel vektoritel on mitu naelu; või neuronite paaridevaheline korrelatsioon; või nende kombinatsioonid. Need on eriti kasulikud treenimiseks, kui elanikkonna tegevuses on mingit erilist kastet, kui see on midagi enamat kui iseseisvate või igavalt lihtsate neuronite komplekti kollektiivne tegevus.

Kolmandaks võime asuda seisukohale, et neuraalne aktiivsus X-is on madala dimensiooniga ruumi teatud kõrgmõõtmeline teostus, kus mõõtmete arv D << n. Tavaliselt peame silmas seda: mõned X-i neuronid on korrelatsioonis, seega ei pea me populatsiooni mõistmiseks kasutama kogu X-i - selle asemel võime need asendada palju lihtsama esitusega. Võiksime aegriba rühmitada otse, nii et X lagundatakse N väiksemaks maatriksiks X_1 kuni X_N, millest kõigil on (suhteliselt) tugevad korrelatsioonid, ja seega saab neid iseseisvalt käsitleda. Või võime kasutada mõnda dimensioonide vähendamise lähenemisviisi, näiteks peamiste komponentide analüüsi, et saada väike aegridade komplekt, millest igaüks kirjeldaks ühte domineerivat vormi populatsiooni aktiivsuses aja jooksul.

Me saame teha rohkem kui see. Ülaltoodud eeldab, et soovime neuronite kokkuvarisemiseks kasutada mõõtmete vähendamist - et rakendame vähendamist X veergudele. Kuid sama hõlpsalt saaksime ka aega kokku lükata, kohaldades mõõtmete vähendamist X ridadele. Selle asemel, et küsida, kas närvitegevus on ülearune. , küsib see, kas erinevatel ajahetkedel on närvi aktiivsuse mustrid sarnased. Kui neid on vaid käputäis, on salvestatud neuronite dünaamika selgelt väga lihtne.

Ka siin saab visata dünaamilisi süsteemseid lähenemisviise. Püüame siinkohal sobitada lihtsaid mudeleid X muutustega aja jooksul (st kaardistada ühelt realt teisele) ja kasutada neid mudeleid X-i sisaldava dünaamika tüüpide kvantifitseerimiseks - kasutades termineid nagu “ligitõmbaja”, “separatrix”, “ sadula sõlme ”,„ pigiharja hargnemine ”ja„ Arsenali varisemine ”(ainult üks neist pole päris asi). Võib usutavalt väita, et selliselt paigaldatud dünaamilised mudelid on kõik tihedusmudelid P (X), kuna need kirjeldavad andmete ülesehitust.

Põrgu, me võiksime proovida ja sobitada X-ga terve närviskeemi dünaamilise mudeli, iga diferentsiaalvõrrandite hulga, mis kirjeldab igat neuroni, nii et meie mudelist P (X) võetakse proovid iga kord, kui me kasutame mudelit erinevatest algtingimustest .

Nende tihedusmudelitega saame need eraldi sobitada närvitegevusega, mille salvestasime hunnikus eri olekutes (S1, S2,…, Sm), ja vastata küsimustele nagu: kuidas muutub neuronite populatsiooni struktuur magamise ja ärkamine? Või looma arendamise ajal? Või ülesande õppimise käigus (kus S1 võib olla 1. katse ja S2 2. katse; või S1 on 1. ja 2. seanss; või nende paljud kombinatsioonid). Samuti võime küsida: mitu dimensiooni neuronite aktiivsus hõlmab? Kas ajukoore eri piirkondade mõõtmed on erinevad? Ja kas keegi on mu võtmeid näinud?

2 / Generatiivsed mudelid P (X | S): mis põhjustab teravik? Nüüd me räägime. Asjad nagu lineaarsed-mittelineaarsed mudelid või üldistatud lineaarsed mudelid. Tavaliselt rakendatakse neid mudeleid üksikutele neuronitele, igas X veerus. Nendega sobitame mudeli, mis kasutab sisendina maailma S olekut ja sülitab välja närvide aktiivsuse seeria, mis vastab neuroni aktiivsusele võimalikult täpselt. Kontrollides seejärel S-i igale tunnusele antud raskust neuroni aktiivsuse taasesitamisel, saame välja mõelda, mida see neuron näib tekitavat.

Me võiksime valida mudeli, millel on teatav paindlikkus, mida loetakse „maailma olekuks“. Saame funktsioonina lisada neuroni enda varasema tegevuse ja vaadata, kas see hoolib sellest, mida ta varem tegi. Mõne tüüpi neuronite puhul on vastus jah. Lõhkemine võib neuronist palju ära võtta ja enne, kui see uuesti minna saab, peab ta vähese puhata saamiseks lamama. Samuti võime mõelda laiemalt ja kaasata ülejäänud elanikkond - ülejäänud X - maailma oleku S osana, kuni neuron töötab. Lõppude lõpuks mõjutavad neuronid aeg-ajalt üksteise tulistamist või nii, et mind pannakse uskuma. Nii et on olemas väike võimalus, et visuaalses ajukoores asuva neuroni reageeringut ei juhita ainult serva orienteeritus välismaailmas, vaid see võib sõltuda ka sellest, mida 10000 sellega ühendavat kortikaalset neuronit ka teevad. See, mida me siis õpime, on elanikkonna ligikaudu kõige mõjukamad neuronid.

Neid generatiivseid mudeleid ei pea me rakendama üksikutele neuronitele. Saame neid rakendada ka oma tihedusmudelites; võime küsida, mida iga klaster või mõõde maailma kodeerib. Või nagu mõned inimesed siin tegid, võime kasutada tihedusmudelit kui maailma olekut ja küsida, millised selle mudeli omadused allavoolu neuronites tekitavad kõmu.

Küsimused, millele saame nende generatiivsete mudelitega vastata, on üsna ilmsed: milline funktsioonide kombinatsioon ennustab kõige paremini neuroni vastust? Kas on neuroneid, mis on selektiivsed ainult ühe asja jaoks? Kuidas neuronid üksteist mõjutavad?

3 / Diskrimineerivad mudelid P (S | X): millist teavet naelu kannavad? See on süsteemide neuroteaduse põhiküsimus, kuna see on väljakutse, millega seisavad silmitsi kõik meie registreeritud populatsioonist allavoolu asuvad neuronid - kõik neuronid, kes saavad sisendeid neuronitest, millelt registreerime ja mis on meie maatriksisse X sisestatud. Nendele allavoolu neuronitele tuleb järeldada, mida nad peavad teadma välismaailmast, mis põhineb ainult naelu.

Siin saame kasutada standardset klassifikaatorit, mis kaardistab sisendid märgistatud väljunditesse. Saame sisendina kasutada X-i ridu, igaüht elanikkonna tegevusest ja proovida ennustada ühte, mõnda või kõiki funktsioone vastavates S. ridades. Võimalik, et ka mõne ajaga, nii et kasutame rida X_t ennustada olekut S_t-n, mis oli n sammu minevikus, kui meid huvitab, kuidas populatsioonid kodeerivad aju sisendavaid olekuid; või võime kasutada rida X_t, et ennustada tulevikus olekut S_t + n, mis on n sammu, kui meid huvitab, kuidas populatsioonid kodeerivad aju mõju maailmale. Nagu ka motoorses ajukoores toimuv, mis toimub enne iga tähe tippimist.

Mõlemal juhul võtame mõned (kuid mitte kõik, sest me ei liialda) X-i read ja koolitame klassifikaatorit, et leida X-i parim võimalik kaardistamine vastava S.-i tükiga. Seejärel kontrollime klassifikaatoril, kui hästi see suudab ennustada ülejäänud S ülejäänud X-ist. Kui teil on erakordselt palju õnne, võivad teie X ja S olla nii pikad, et suudate need jagada treenimiseks, testimiseks ja valideerimiseks. Viimast tuleb hoida lukustatud kastis.

Muidugi võiksime kasutada nii võimsat klassifikaatorit, kui meile meeldib. Logistilisest regressioonist Bayesian lähenemisviiside kaudu 23-kihilise närvivõrgu kasutamiseni. See sõltub pigem sellest, mida te vastusest soovite, ning teile arusaadava tõlgendatavuse ja jõu vahelist kompromissi. Minu mujal tehtud kirjutised on teinud selgeks, kumba poole ma sellest kompromissist pooldan. Kuid mul on hea meel, et olen eksinud.

Neuronite kodeerivad mudelid on mõistvad, kuid puudutavad mõnda vana ja sügavat filosoofilist keerukust. Kodeeringu testimine diskrimineeriva mudeli abil eeldab, et midagi allavoolu üritab S-i närvi aktiivsusest dekodeerida. Sellel on kaks probleemi. Neuronid ei dekodeeri; neuronid võtavad naelu sisendina ja väljastavad oma naelu. Pigem kodeerivad nad ühest naelu komplektist teise naelu komplekti: võib-olla vähem või aeglasemalt; võib-olla rohkem või kiiremini; võib-olla ühtlasest voolust võnkesse. Nii et diskrimineerivad mudelid küsivad täpsemalt, millist teavet meie neuronid uuesti kodeerivad. Kuid isegi kui me seda seisukohta võtame, on siin sügavam probleem.

Ainult väheste eranditega ei ole sellist asja nagu "allavoolu" neuron. Neuronid, mille me X-s salvestasime, on keeruka juhtmega aju osa, täis lõputuid silmuseid; nende väljund mõjutab nende endi sisendit. Mis veelgi hullem, mõned X-i neuronid asuvad teistest allavoolu: mõni neist siseneb otse teistesse. Sest nagu eespool märgitud, mõjutavad neuronid üksteist.

Jäme, võib-olla kasulik manifest närvandmete teaduse jaoks. See on puudulik; kahtlemata on midagi ülaltoodust valesti (vastused postkaardil tavalisele aadressile). Eespool kirjeldatu on katse sünteesida väga erinevate huvidega laborite töörühm, kuid tavaline soov kasutada seda tüüpi mudeleid suurtes närviandmete komplektides, et vastata sügavatele küsimustele, kuidas ajud töötavad. Paljud neist on andmelaborid, meeskonnad, kes analüüsivad eksperimentaalseid andmeid oma küsimustele vastamiseks; kui nimetada mõnda - Johnathani padi; Christian Machens; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O'Donnell; Il Memmingi park; Jakob Macke; Gasper Tkacik; Oliver Marre. Ee, mina. Teised on eksperimentaalsed laborid, millel on tugevad andmeteaduste kalduvused: Anne Churchland; Mark Churchland; Nicole Rust; Krishna Shenoy; Carlos Brody; paljude teiste pärast vabandan, et ei nimetata.

On konverentse, kus selline töö on teretulnud, seda julgustatakse isegi mitte. Neuraalsete andmete teadusajakiri on käes. Midagi ehitab. Tulge sisse, andmed on armsad *.

* jah, ma pidin viitama andmetele kui ainsusele, et see jama tööle saada. See, et kirjutan selle selgitamiseks seda joonealust märkust, annab teile ettekujutuse, mida teadlased eeldavad närviliste andmete üksikasjade nõudmisele.

Tahad rohkem? Jälgi meid Spike'is

Twitter: @markdhumphries