John D. Kelleher, Brendan Tierney
ISBN: 978-953-246-421-4
Izdavač: Mate d.o.o.
Godina izdavanja: 2021.
Opće informacije: Meki uvez, 284 str., 12,5 x 17,5 cm
Dostupno: Ne
Znanost o podacima obuhvaća skup načela, definicija problema, algoritama i procesa za izvlačenje nejasnih i korisnih uzoraka iz velikih podataka (Big Data) s ciljem poboljšanja donošenja odluka temeljenjim na uvidima u velike podatke. Kao područje djelovanja, znanost o podacima obuhvaća skup načela, definicija problema, algoritama i procesa za izvlačenje neočiglednih, ali korisnih uzoraka ponašanja podataka iz velikih podataka. Ona je usko povezana s područjima rudarenja podataka i strojnog učenja, ali je opsegom od njih šira.
Danas znanost o podacima upravlja donošenjem odluka u gotovo svim dijelovima modernih društava. Neki od načina na koje znanost o podacima može utjecati na vaš svakodnevni život, između ostalog, uključuju: izbor oglasa koji vam se nude putem virtualnog oglašavanja; to su preporuke za filmove koje biste trebali pogledati, knjige koje biste trebali pročitati i prijateljske veze koje biste trebali uspostaviti; prijedloge o tome koje poruke e-pošte svrstati u mapu neželjene pošte; pogodnosti koje će vam se ponuditi prilikom obnove pretplate na uslugu mobitela; ponudu cijene premije zdravstvenog osiguranja koja vam
se nudi; razmještaj i dinamiku funkcioniranja semafora u vašem području; sastav lijekova koje trebate; kao i to na kojim mjestima u vašem gradu vreba policija.
Cilj ove knjige je pružiti uvod u znanost o podacima koji pokriva njezina suštinska dostignuća, do razine koja osigurava principijelno razumijevanje područja.
Prvo poglavlje uvodi područje znanosti o podacima i daje kratak prikaz njegova razvoja. Također se objašnjava zašto je znanost o podacima važna danas i navode neki od čimbenika koji utječu na njezino usvajanje.
Drugo poglavlje uvodi temeljne pojmove vezane uz same podatke. Ono također opisuje standardne faze provedbe projekata znanosti o podacima: razumijevanje poslovanja, razumijevanje podataka, priprema podataka, modeliranje, vrednovanje i implementacija.
Treće poglavlje opisuje tipičnu infrastrukturu organizacija, uspostavljenu za potrebe znanosti o podacima, kao i neka suvremena rješenja vezana uz problem kolanja velikih skupova podataka unutar podatkovne infrastrukture, koja uključuju korištenje strojnog učenja integriranog s bazom podataka, korištenje sustava Hadoop za pohranu podataka i njihovu obradu, te razvoj hibridnih sustava baza podataka koji glatko kombiniraju tradicionalna programska rješenja za baze podataka i rješenja slična Hadoopu.
Četvrto poglavlje uvodi područje strojnog učenja i objašnjava neke od najpopularnijih algoritama i modela strojnog učenja, uključujući neuronske mreže, modele dubokog učenja i modele stabla odlučivanja.
Peto poglavlje usredotočuje se na povezivanje ekspertize u domeni strojnog učenje s problemima iz stvarnog svijeta, prikazom niza standardnih poslovnih problema i opisivanjem njihova rješavanja uz pomoć strojnog učenja.
Šesto poglavlje razmatra etičke posljedice znanosti o podacima, najnovija dostignuća u pravnoj regulativi u tom području, kao i neke nove računalne pristupe očuvanju privatnosti pojedinaca u procesima vezanim uz velike podatke.
Naposljetku, sedmo poglavlje opisuje neka od područja u kojima će znanost o podacima imati značajan utjecaj u bliskoj budućnosti i postavlja neka od načela koja su važna za to hoće li projekt iz njezina dosega biti uspješan ili ne.