Masinõpe, tehisintellekt ja närvivõrgud: milles on erinevus?

Sissejuhatus

Masinõpe teeb ühte asja väga algtasemel. See toidab kas teadaolevaid või tundmatuid andmeid ja leiab antud ülesande jaoks optimaalsed väljundid. Insener peab määrama ülesande ja kasutatavate andmete allika. Näiteks piltide teksti tuvastamiseks OCR (optiline märkituvastus) peab olema komplekt pilti või koht nende leidmiseks, klientide profiilide koostamine nõuab kliendi andmeid, teede tuvastamine maanteelt pilte. Pärast nende mudelite ehitamist ja koolitamist on võimatu proovida üht teise ülesannet täitma panna. Siin erinevad masinõpe ja tõeline tehisintellekt.

Masinõppest räägitakse sageli kui tehisintellektiga samaväärsest. AI ja masinõppe võrdsustamine on aga nagu Ferrari võrdsustamine selle edastamisega. Käigukast on Ferrari oluline komponent, kuid lihtsalt ülekande omamine ei tähenda, et teil Ferrarit oleks; see on ainult üks samm ühe ehitamise suunas. Võtke see näide masinõppe abil. Ferrari (AI) ehitamiseks peame kokku panema piisavalt kvaliteetsed auto (masinõppe) komponendid.

Praegu ühendavad ettevõtted ja teadlased erinevaid masinõppe tehnikaid konkreetsete probleemide lahendamiseks, näiteks isesõitvad autod, automatiseeritud aktsiatega kauplemine või põllumajanduse analüüs. See pole tõsi tehisintellekt. Tõeline AI on see, kui masin suudab lahendada kõik täiesti tundmatud probleemid. Masinõpe on mõeldud teadaolevate või tundmatute andmete korral ühe teadaoleva ja konkreetse probleemi lahendamiseks.

Autode analoogiale viidates on ettevõtted loonud piisavalt madala kvaliteediga komponentidega lihtsa AI, et toota esimene „auto” mudel, nagu IBMi Watson, kuid kes laseb toore Ford Model T 2019. aastal tööle? Need näited on lihtsalt palju koos töötavaid masinõppevõrgustikke, mida nende loojad tavaliselt tähistavad kui AI-d. See pole aga tõsi tehisintellekt; tõeline tehisintellekt on tulevikus veel kaugel.

Neuraalsed võrgud ja sügav õppimine

Tänapäeval arutades AI, masinõppe või mõne muu infotehnoloogia pilkupüüdvat teemat, peate kusagil vastama fraasile „sügav õppimine” või „närvivõrk”. Neuraalvõrgud on masinõppe alamhulk, ehkki keerukam versioon ja kuidas lahendatakse moodsaimad masinõppeülesanded. Neuraalvõrgu eesmärk on jäljendada, kuidas inimese aju töötleb väliseid stiimuleid nägemiseks, kuulmiseks ja muudeks bioloogilisteks reaktsioonideks. Kuna inimese aju on väga keeruline teema, nii nagu ka närvivõrgud, annan sellest ainult lühikese ülevaate, et saada umbkaudne arusaam.

Neuraalvõrgud kasutavad sisend- ja väljundkihti koos keskel asuvate „peidetud” kihtidega. Need keskmised kihid teevad otsused eelneva kihi sisendi põhjal ja postitavad valiku võimaluse järgmisele kihile. Lihtsas närvivõrgus on see voog sisend-peidetud-väljund. “Süvaõppimise” närvivõrgud on lihtsalt mitme varjatud kihiga neuraalsed võrgud. See tundub segane, kuid mõelge, kuidas aju objekti ära tunneb. Esmalt korjab see kuju, seejärel otsustab, kas on veepudel, müts või mõni muu ese. See on näide närvivõrgust, kuid enamasti ei piisa ainult kujust (üks kiht).

krediit: (https://towardsdatascience.com/)

Seejärel otsustab teie aju muude tegurite, näiteks värvi, läbipaistmatuse, siltide põhjal, loend jätkub. Just seda püüab sügav õppimine jäljendada. Lihtsas kahekihilises süvaõppevõrgus võtame ühe kihi kuju, seejärel otsustame tõenäosuse, et kuju koos järgmise kihi värviga on veepudel, müts või auto. See on tegelikult lihtsustatud versioon toimuvast, kuid on oluline sellest kontseptsioonist aru saada. Süvaõppevõrkudel võib olla nii palju kihte, kui soovite, ja seega võivad need olla palju keerukamad.

Oluline on märkida, et iga masinõppe probleemi saab süvaõppe kasutamiseks üle kanda, seadistamiseks kulub lihtsalt rohkem tööd ja üldiselt on vaja palju rohkem andmeid. Kuna süvaõppevõrgud võivad vastu võtta suuri andmeid, on suured ettevõtted neid üha enam kasutanud. Nad on isegi mõnes kognitiivses ülesandes suutnud inimesi peksta, näiteks IBMi Watson peksis Jeopardy võistlejaid.

Juhendatud ja juhendamata õppimine

Masinõpe jaguneb kahte erinevasse kategooriasse vastavalt andmete tüübile, millest mudelit õpitakse. Juhendatud õppes kasutatakse struktureeritud andmekogumeid, millel on märgistatud tulemused, mis näitavad, kas masin analüüsis andmeid õigesti. Juhendamata õppes kasutatakse eelnevate andmete põhjal ülesande mustrite või järelduste leidmiseks struktureerimata ja abstraktseid andmekogumeid.

Juhendatud õpe (ainepunkt: https://medium.com/@gowthamy/machine-learning-supervised-learning-vs-unsu supervised-learning-f1658e12a780)

Juhendatud õppe korral "juhendate" masinat, andes sellele andmekogumi, mille keegi on õigesti vastanud. Mõelge õuna äratundmisele puuviljapiltide põhjal. Saate luua piltide komplekti ja seada nende failinimi vastavatele viljadele. Kui masin hakkab mudeli jaoks erinevaid tehnikaid õppima ja katsetama, saab see lõpliku vastuse (failinime põhjal), kas puuvilja tüüpi õnnestus tuvastada või mitte.

Juhendamata õpe (ainepunkt: https://medium.com/@gowthamy/machine-learning-supervised-learning-vs-unsu supervised-learning-f1658e12a780)

Teisest küljest kasutab masin juhendamata õppimise korral märgistamata andmekogumeid või 'tundmatuid' andmeid. See võib olla laiaulatusliku statistika koostamisel kasulikum. Näiteks on Google'i ja Facebooki reklaami API abil täiesti võimalik reklaamiportfelli loomine, mis on suunatud pikamaa suhetes olevatele inimestele, kes hiljuti said endale koera ja armastasid pastat. Selle põhjuseks on asjaolu, et masinad õpivad teie andmete üle järelevaatamata, omandades võime ennustada sellist tüüpi profiile vastavalt kasutaja omadustele ja eelnevale tegevusele.

Nagu arvata võis, on juhendamata õppevõtted väärtuslikumad kui juhendatavad, sest märgistamata andmeid on tänapäeva ühiskonnas palju rohkem. Juhendamata õppimisel on võime vaadata keerulisi andmeid ja neid võimalikult olulisel viisil järjestada, ilma et neile öeldaks, mis on „õige” või „vale”. Oluline on teada, et mõlemat meetodit saab kasutada mis tahes probleemi korral, kuid üks meetod on üldiselt parem kui teine, sõltuvalt asjaoludest.

Klassifikatsioon ja regressioon

Masinaõppe abil probleemi lahendamisel on sageli erinevad eesmärgid, näiteks objekti tuvastamine või kasutaja sisestamise ennustamine. Võtke õunaprobleem - meie eesmärk oli pilt klassifitseerida ja otsustada, milliste puuviljadega antud mõttetu pikslite komplekt korreleerub. Seda peetakse klassifitseerijaks, kuna see klassifitseerib pikselipiirkonnad ja otsustab, millised viljad see võiks olla. Seejärel võtke arvesse analüütiline probleem - ennustada ostja profiili eelnevate klientide andmete põhjal. See on nn regressiooniprobleem, mis tuleneb eelnevate andmete kasutamisest prognooside tegemisel selle kohta, kas antud klient on tõepoolest pasta armastav, pikamaajooksja, koerajalutaja.

krediit (https://aldro61.github.io/microbiome-summer-school-2017/sections/basics/)

Klassifikatsioon on ülesande omistada antud objektile etikett. Näiteks kasutab isesõitv auto klassifikatsiooni, et teha kindlaks, kas teel olev objekt on jalgrattur, mõni muu auto, maha kukkunud puu jne. Seda saab seejärel kasutada koos teiste masinõppemudelitega, et genereerida õige vastus äsja leitud objekt. Klassifikatsiooni eesmärk on anda arvutitele võime objekte ära tunda, tavaliselt, kuid mitte alati piltide põhjal.

Teisest küljest kasutatakse regressiooni andmete põhjal statistiliste ennustuste tegemiseks. Kasutades sama isesõitva auto näidet, võiks regressioon olla tehnoloogia, mida kasutatakse teejoonte leidmiseks. Kõik teeliinid pole ideaalselt värvitud, mõnel on tühimikke, pragusid või pole neid üldse. Arvutiteadlased saavad regressiooni abil analüüsida, kus nad eeldavad joone olemasolu ka siis, kui seda pole, tuginedes sõidu varasematele teeliine käsitlevatele andmetele.

Klassifitseerimine ja regressioon pole ainsad süvaõppe meetodid. Need on vaid kaks peamist kategooriat, mille alla enamik masinõppe algoritme kuulub. Masinõppe algoritmide uurimiseks soovitan seda artiklit väga.

Tuues selle kõik kokku

Tehisintellekt on väga lai mõiste, mida kasutatakse sageli vaheldumisi masinõppega, kuid tegelikult on masinõpe tehisintellekti alamhulk. Pidage meeles, et AI on Ferrari ja masinõpe on üks komponente, mis seda võimaldab, nagu käigukast. Inimeste moodi mõtlemise koolitamine on AI eesmärk ja see saavutatakse osaliselt masinõppe abil, kuid kindla ülesande täitmiseks.

Neuraalvõrgud on masinõppe rakendamine, mille peamine eesmärk on aju matkimine. Neuraalvõrkudel on vähemalt üks kiht sisendandmete põhjal väljundjärelduste tegemiseks. Neile võrkudele saate lisada rohkem kihte ja tulemuseks on veel üks alamhulk, mida tuntakse süvaõppena. Sügav õppimine tähendab lihtsalt enam kui ühe kihiga närvivõrku.

Masinõppe hõlbustamiseks on vaja andmeid, millest prognoosida. Neid andmeid võib sildistada või sildistada ning saadud õpimudelit tuntakse vastavalt kas järelevalve või järelvalveta. Juhendamata õppimisel on eeliseid, näiteks ei vaja eeltöödeldud andmekogumite loomiseks inimese sekkumist, kuid sellel on puudusi, näiteks kui optimaalse oleku saavutamiseks on vaja palju andmeid.

Masinõppes kasutatakse õppimisel kahte peamist lähenemisviisi, milleks on klassifitseerimine ja regressioon. Klassifikatsioon kasutab andmeid järelduste tegemiseks ja nende objektide klassidesse märgistamiseks. Näiteks võib haide pilte klassifitseerida kaladeks ja väljaheiteid toolideks. Regressioon seevastu kasutab andmeid tundmatute kohta ennustuste loomiseks. Selle näiteks on kliendi kviitungite andmete kasutamine, et saata neile kuponge, mis on nende ostmise suhtes asjakohased. Seda tehnoloogiat kasutatakse tegelikult paljudes suuremates toidupoodides kogu maailmas.

Selle masinõppe lühikokkuvõttega loodan, et olen hõlbustanud teie inimesel selle teema õppimist. Masinõpe võib suurte matemaatiliste terminite ja väljenditega tunduda väga hirmutav. Seega jagage enne jätkamist suuremad mõisted arusaadavamateks mõisteteks. Kui teile see blogipostitus meeldis, jälgige kindlasti ka mind minu sotsiaalmeedias, et olla kursis minu värskeima sisuga (twitteri link allpool)!

Viited

DigitalOcean. „Sisu”. SQLite vs MySQL vs PostgreSQL: andmebaaside relatiivsete haldussüsteemide võrdlus | DigitalOcean, DigitalOcean, 11. detsember 2017, www.digitalocean.com/community/tutorials/an-introduction-to-machine-learning.

Brownlee, Jason. “Erinevus klassifitseerimise ja regressiooni vahel masinõppes.” Masinõppe meisterlikkus, 25. september 2017, www.machinelearningmastery.com/classification-versus-regression-in-chine-learning/.

“Autosõitja juhend Pythoni masinõppesse.” FreeCodeCamp.org, FreeCodeCamp.org, 1. august 2017, www.medium.freecodecamp.org/the-hitchhikers-guide-to-machine-learning-algorithms-in-python- bfad66adb378.