Big data bliver så stor, det glider Jordens grimme bånd.
En opstart kaldet Orbital Insight, som for nylig rejste næsten 9 millioner dollars i finansiering, bruger satellitbilleder og avancerede computerteknikker til at estimere verdensomspændende olieoverskud, forudsige afgrøder underskud før høsttid og se detailtrendene ved at holde styr på antallet af biler i store bokse-parkeringspladser. Det skal også være muligt at træne softwaren til at opdage ulovlig skovrydning tidligt og bedre spore klimaforandringer.
Virksomheden bruger maskinlæringsteknikker og computernetværk, der efterligner den menneskelige hjerne for at få øje på mønstre i store mængder visuelle data. Facebook bruger lignende teknikker til at genkende ansigter i uploadede billeder og automatisk tagge dig og dine venner. Men i stedet for at søge efter ansigter drager Orbital Insight fordel af den voksende overflod af satellitbilleder takket være fremkomsten af små lavpris-satellitter og lære deres netværk automatisk at genkende ting som køretøjer, konstruktionshastigheden i Kina og skyggerne støbt af flydende låg oliebeholdere, der ændrer sig afhængigt af hvor fyldige de er.
Det ville naturligvis være umuligt for mennesker at sile gennem regelmæssigt opdaterede globale satellitbilleder. Men med massivt parallelle computere og avancerede mønstergenkendelsesteknikker sigter Orbital Insight at levere typer data, der ikke har været tilgængelige før. De aktuelle globale skøn over olie er for eksempel allerede seks uger gamle, når de offentliggøres. Med Orbital kunne analyse af afgrøder leveres midt i sæsonen - vigtig information at have, uanset om du er en FN-arbejdstager på højt niveau, der prøver at komme foran en fødevarekrise, eller en handelshandler, der arbejder for en hedgefond.
Orbital Insight har ikke eksisteret længe - det blev grundlagt i slutningen af 2013 og kom først ud af "stealth mode" sent i sidste år. Men virksomhedens grundlægger, James Crawford, har masser af erfaring inden for kompatible områder. Han var tidligere autonomi- og robotikchef ved NASAs Ames Research Center og tilbragte også to år som ingeniørdirektør hos Google Books og gjorde arkiverede trykte sider til søgbar tekst.
Flere virksomheder, som Spire og Inmarsat, og endda Teslas Elon Musk, arbejder på hardware - design og lancering af nye netværk af satellitter - men Crawford siger, at Orbital Insight i stedet fokuserer rent på software.
”På nogle måder ser jeg, hvad vi laver her i drivkraften for dette selskab, ” siger Crawford, ”tager meget af læringen [hos Google] om, hvordan man udfører big data, hvordan man anvender [kunstig intelligens], hvordan man bruger maskinlæring på disse rørledninger af billeder og anvender det på satellitpladsen. ”
Crawfords virksomhed er muligvis et af de få, der arbejder på at bruge nye softwareteknikker såsom kunstige neurale netværk og maskinlæring til at parse satellit billedsprog. Men den teknik, han bruger, også kendt som dyb læring, eksploderer i teknologirummet i øjeblikket. Etablerede virksomheder som Facebook, Google og Microsoft bruger dyb læringsteknikker til ting som automatisk billedmærkning og forbedret talegenkendelse og oversættelse. IBM har også for nylig erhvervet en dyb læringsvirksomhed, kaldet AlchemyAPI, for at forbedre deres Watson-computersystem.
Med dyb læring, efterligner kraftfulde computere og flere lag med samtidig kørsel af mønstergeneration (deraf det "dybe" i dyb læring) de neurale netværk i den menneskelige hjerne. Målet er at få en computer til at "lære" at genkende mønstre eller udføre opgaver, der ville være for kompliceret og tidskrævende til at "undervise" ved hjælp af traditionel software.
Detaljerne om dyb læring er tekniske, men på det helt basale niveau er det overraskende enkelt. Når det gælder målingen af detailtrendene med parkeringspladsaktivitet, siger Crawford, at virksomheden først har ansatte manuelt mærket biler på et par hundrede parkeringspladser med røde prikker. ”Derefter fører du hver enkelt bil ind i det neurale netværk, og det generaliserer mønstre af lys og mørke, mønsteret af pixels i en bil, ” siger Crawford. ”Og når [computeren] ser på et nyt billede, er det, der i det væsentlige gør, temmelig sofistikeret, men stadig grundlæggende et mønster match.”
Ved estimering af detailaktivitet siger Crawford, at hans virksomhed er meget bedre til at udlede, hvordan en kæde har det på nationalt plan, ved at måle, hvor fulde parkeringspladser er over tid og sammenligne det med, hvor fulde de samme partier var i tidligere kvartaler ved hjælp af ældre billeder, end at måle sundheden i en individuel butik.
Han indrømmer, at mange detailhandlere allerede har måder at spore disse data på for deres egne butikker, men de ville være glade for at vide, hvordan deres konkurrenter har det i måneder, inden de økonomiske resultater frigives. Det samme gælder hedgefonde, som Crawford siger, er nogle af selskabets tidligste kunder. Det er let at se, hvordan denne type data kan give investorerne et ben op. Satellitbillederne er allerede tilgængelige, og Orbital Insight analyserer det bare, så det er usandsynligt, at der vil fremkomme problemer med insiderhandel.
Hvis netværket begår en lejlighedsvis fejltagelse, siger at forvirre en dumpster til en bil, er det ikke meget af et problem, forklarer Crawford, fordi fejlene har en tendens til at annullere hinanden i stor skala. For ting som olieestimater, selvom de er væk med flere procentpoint, er det stadig bedre end at vente op til seks uger på mere konkrete data.
Mens opstart synes at være fokuseret på at levere data til markedsinvestorer først, kunne det, virksomheden gør, også bruges til mere altruistisk brug. ”Vi er nysgerrige i fremtiden med at bruge dette til at opdage skovrydning og at opdage ting som vejbygning, der kan være en forløber for afskovning, ” siger Crawford. ”Der er også rigtig interessante ting, der kan gøres omkring at se på snepakke, vand og andre aspekter af klimaforandringer.” Han siger også, at de ser på landbrug i den tredje verden, og siger, at multispektralsbilleder er en god måde at fortælle hvor sunde planter er, for at forudsige afgrødefejl.
Naturligvis bringer ethvert aspekt af big data, der også inkorporerer satellitbilleder, beskyttelse af personlige oplysninger. Men Orbital Insight tager ikke billederne, de får adgang til og analyserer billeder, der allerede er tilgængelige. Og som Crawford påpeger, bestemmer de nuværende amerikanske regler for kommercielle billeddannelsessatellitter, at du ikke kan gå under 20 cm pr. Pixel. Ved denne opløsning ville den gennemsnitlige person dukke op som et par prikker. Så det ville være svært at skelne mellem enkeltpersoner overhovedet, så meget mindre en persons identitet eller endda køn.
Crawford siger, at meget af de kortsigtede fremskridt inden for dyb læringsteknikker generelt vil involvere forenkling og automatisering af tweaks til algoritmerne (hvilket betyder mindre manuelt mærkning af biler eller majsfelter), så virksomheder hurtigere kan anvende maskinlæring til nye områder.
Hvad angår fremtiden for Orbital Insight, taler virksomhedens grundlægger bestemt ikke lille. Han sammenligner hvad virksomheden laver med at skabe et "makroskop", der kan påvirke verden i samme grad som mikroskopet transformerede biologi.
”Meget af det, vi ser om Jorden, hvad enten det er majsudbytte eller skovrydning eller oliebeholdning, er så store, at du ikke kan se dem med det menneskelige øje, fordi du bliver nødt til at behandle en million billeder på én gang, ”Siger Crawford. "Det vil i sidste ende ændre den måde, vi ser på Jorden, ændre den måde, vi tænker på den, og ændre den måde, vi tænker på at styre den på."