Forrás: Franz Leberl, Bela Markus: MODELING THE HUMAN HABITAT IN 3D FOR THE INTERNET (szerkesztés alatt)

2008. augusztus 26-án Franz Leberl professzor, a Microsoft „Virtual Earth" programjának vezető kutatója egyetemünkön járt és a professzionális Internet alkalmazások jelenéről és jövőjéről tartott előadást.

2005 márciusában Bill Gates az 50. születésnapja alkalmából tartott rendezvényen beszélt először a "Virtual Earth Vision" nevű elképzeléséről. Az ötlet lényege egy olyan program megvalósítása, melynek segítségével „Képesek leszünk London belvárosában sétálni és látni az üzleteket, áruházakat és, hogy milyen a forgalom. Beléphetünk egy üzletbe és nézelődhetünk az áruk között. Mindezt nem a weben ma használatos sík, és kétdimenziós kezelőfelületen, hanem a virtuális valóság bejárásával."

Egy ilyen terv megvalósítását a számítási kapacitás, kommunikációs sávszélesség, tárolási kapacitás növelésében a közelmúltban elért robbanásszerű fejlődés teszi lehetővé.

A Microsoft kezdeményezése, hasonló, más internetes szolgáltatók kezdeményezéseivel együtt (elsősorban Google), példaként és iránymutatásként szolgálhat a jövő számítástechnikája és számítástechnikai gondolkodásmódjára nézve. Ez a fejlődés a lakott területek teljesen automatikus 3d modellezésében történt kutatásokat nagyban inspirálta és az innováció egyik aktív területévé vált. A 3D városmodellek készítésének automatizálási szintje profitált az adatforrásként felhasznált légi vagy utcai fotók nagy átfedéséből adódó redundancia növekedéséből.

Az előadáson elhangzott, hogyan lehetséges légifotók alapján megalkotni egy teljes város 3D modelljét teljesen automatikusan, üzletileg elfogadható költségek mellett. E modellt, geometriai keretként használva, további részletekkel bővíthetjük utca-szintű és beltéri képekkel vagy lézerscan adatokkal. Ilyen adatok készülhetnek rendszerezetten vagy „általunk", a névtelen felhasználók közössége által. Az eredmény egy globális geo-adatbázis amely akár 10-15 cm-es pixelméretű légifelvételekből, 2cm-es felbontású utcai állományokból és 0.5 cm-es belső vagy kereskedelmileg fontos részletekről áll össze. Ezek aztán több ezer várost és esetleg kisebb településeket is tartalmazó adatbázissá fognak összeállni, melyhez több mint 1 Exabyte-nyi adatot kell majd elkészíteni és karbantartani.

Ha látni akarjuk, hogyan fejlődött a fotogrammetria egy film-alapú tevékenységből egy teljesen digitális munkafolyamattá, elég áttekintenünk a Nemzetközi Fotogrammetriai és Távérzékelési Társaság négyévenkénti kongresszusának főbb témáit:

  • 1992 (Baltimore) Film szkennelése azért, hogy lehetőség legyen fotogrammetriai képek digitális feldolgozására
  • 1996 (Bécs) A sztereo digitális felváltja a 100 éves sztereo optikai eljárást
  • 2000 (Amsterdam) Digitális légifotó kamerák bemutatása, melyek gyakorlati felhasználásra várnak
  • 2004 (Isztambul) Első beszámolók a digitális légifotó kamerák használatáról és a digitális érzékelés előnyeiről a hagyományos filmalapúval szemben
  • 2008 (Peking) Az internet felhasználja és szolgáltatja a geo-adatot 2 és 3 dimenzióban

A teljes automatizáltság szolgál alapjául a lakott területek 3d modellezésének fotorealisztikus leképezéshez és alkalmazásokhoz: az automatizálás olyan adategység költséget eredményez, hogy egy nagyméretarányú adatbázis fejlesztés is megvalósítható és megfizethető. Ezek alapján a technológia az automatizált 3D városmodellezésre megfelelő szinten, részletességgel és pontossággal rendelkezésre áll.

Háromdimenziós modellek készítése légifényképek felhasználásával

Tegyük fel, hogy 3000 város közel 1.5 milliárd ember otthona. Az átlagos lakosság városonként 500 000 lenne. Épületenként 10 embert véve 50 000 épületet kellene városonként modellezni, ami összesen 150 milliót jelentene. Ha az épületekre rendelkezésre álló költségvetés mondjuk 100 millió $ lenne akkor épületenként kevesebb, mint 1$-os keretből kellene gazdálkodni. Ilyen költségeket pedig csak egy nagymértékben automatizált fotogrammetriai modellezési eljárással lehetne megvalósítani. A nagyfokú automatizáltság megköveteli az adatok nagyfokú redundanciáját. A kalkulációknál 10-es redundancia faktort, a fotogrammetriai eljárásnál 80%-os soron belüli és 60%-os sorok közötti átfedést vettünk alapul. A táblázat bemutatja a becsléseket és az ezek alapján végzett számításokat.

A számok megmutatják az említett 3000 város alapján a 3D modellezés költségeit. Ha adott egy 100 millió $-os keret a városok modellezésére, akkor az egyes épületekre átlagosan 0.7$ jut. 10 cm-es mintavételezési távolságot alapul véve, mintegy 10 millió felvétellel kellene dolgozni. Az egész Föld felszínét 351 millió képpel lehetne lefedni 15cm -es mintavételezési távolsággal 10-x redundanciával számolva. Ez összességében körülbelül 200PBytenyi adatot jelentene.

Adatfeldolgozás

A táblázat választ ad arra hogy mért szükséges a teljesen automatizált eljárás a 3d városmodellezésben. Egy ilyen eljárásnak, feltéve hogy rendelkezésre áll, 8 feltételt kell teljesítenie:

  1. Kiváló légi digitális képalkotó eszköznek radiometriailag 7000 szürke értéket kell tudni megkülönböztetnie.
  2. Okos adatgyűjtési stratégiák azért, hogy kis költséggel elérhető legyen a nagyfokú redundancia, soron belül 80% sorok között 60%. A nagy soron belüli átfedéshez szükséges megfelelően gyors képismétlési arány plusz költségek nélkül is elérhető, a fedélzeti tároló kapacitás növeléssel, pedig egy felszállással képek ezreit lehet elkészíteni.
  3. Teljesen automatizált légiháromszögelés nagy 3000+ kép/város blokkokkal;
  4. Nagy adathalmazok könnyű kezelése, mivel egy városról akár 5 Tbytenyi adat is készülhet;
  5. Teljesen automatizált objektum besorolás, épületek, fák, növényzet, vizes területek, úthálózat, ez a nagyfokú redundancia miatt kivitelezhető.
  6. Teljesen automatizált digitális felületmodell (DSM) létrehozása és kettéválasztása digitális terepmodellé (DTM) és függőleges objektumokká (épületek, fák); ez is létező eljárás, a korszerű „dense matching"
  7. Nagyfokú geometriai pontosság, subpixeles nagyságrendű
  8. Intelligens számításgyorsítás

Geometriai pontosság

Az internetre történő városi területek modellezésének csak a látványt kell szem előtt tartania, és a sikerhez nagy geometriai pontosságra van szükség

„Végtelen részletesség"

A különböző szolgáltatók versenyéből már kiderült, hogy nagy figyelmet fordítanak az „emberi léptékű megjelenítésre". Ez abban mutatkozik meg, hogy olyan képeket tesznek az interneten elérhetővé, ami azt mutatja, milyen látványban lenne a felhasználónak része ha azon az adott térképi ponton állna. Az ilyen képek általában kb. 2cm-es felbontásúak, hogy a felhasználók el tudják olvasni a képeken a feliratokat. A Google már bemutatta a Street-View nevű megoldását és a Microsoft is hasonló alkalmazáson dolgozik, habár nagyon sokan aggódnak, hogy az ilyen részletesség már sérti az emberek magánéletét.

Amíg a 2cm-es felbontás megfelelő élményt nyújt az utcaképeknél, összességében mégse mindenhol elég. Az épületek belseje iránt is van érdeklődés, mint például bevásárló központok, vallási vagy kulturális intézmények esetében. Belterek esetében még nagyobb felbontásra lehet szükség, így az elérheti a 0.5cm-es pixelméretet is.

Fejlesztési kihívások

Már maga az ötlet is, hogy létrehozzunk egy 1 Exabyte-ot meghaladó részletes 3d modellt a lakott területekről, önmagában számos kutatási kihívást vet fel, ugyanakkor lehetőséget nyújt a  sikerre. A szándék az, hogy a teljesen automatizált adatnyerési, aktualizálási eljárás továbbfejlődjön a sűrű geometriai információk minden részletességi szintjén.

A munka az utcák fényképezésével csak most kezdődött. Ahelyett hogy képeket mutatunk be, hasznos lenne az utcai helyszínek geometriai modelljeinek renderelése, ezáltal csökkentve a tárolandó karbantartandó és szolgáltatandó adatmennyiséget, illetve megszűntetni a magánszféra megsértésével kapcsolatos jogi kifogásokat.

Az épületek belsejébe való betekintés jelentősen növeli a kihívásokat, ezen problémával a kutatások még csak érintőlegesen foglalkoztak.

Ahogy valaki feltölti az adattárat a kezdeti adatokkal, rögtön felvetül a kérdés: mi lesz az adat elavulásával? Az automatikus hibakeresés a felhasználók hibajelentései alapján vagy a nyilvános bejegyzések vizsgálata a változások dokumentálása végett mind ,érdekes kutatási témák. És ha már tudjuk hogy változások történtek, akkor szembesülünk a 3D adattárak frissítés-automatizálásának problémájával, melyre jóval kevesebb a pénzügyi keret, mint amely rendelkezésre áll a rendszer beindításához.

Az ortofotókon az autók jelenléte nem fontos, mivel az egyik pillanatban ott vannak a másikban már nincsenek. A 3D modellen az autók csak vizuális összevisszaságot jelentenek. Az utca fényképezésnél látszódhat az autók rendszámtáblája ezért is kívánatos lehet a járművek „eltűntetése" a képről. Az eltűntetett autók helyére grafikusan generált modelleket lehet helyezni. Az autók felismerése és eltávolítása történhet „boosting" módszerrel. Az autók felismerhetők az ortofotón 2D formájuk, és színük által, de a 3D pontfelhők használatával is, vagy az alapján, hogy általában az utakon találhatók.

A növényzet nagyban hasonlít az autókra abban az értelemben, hogy viszonylag gyorsan változik az idő múlásával, például évszakról évszakra, meglehetősen összetett és ezért célszerűbb lehetőség szerint modellekkel helyettesíteni. A 11. ábra azt mutatja be, hogy a Virtual Earth már most felismeri a növényzetet és egy külön program segítségével megrajzoltatják (renderelik) a növényeket ahelyett, hogy a róluk készült képeket használnák.

Végül, a 12. ábra egy közbenső eredményt mutat, amelynek az a célja, hogy az utcákról készült kép helyett valamilyen egyszerűsített ábrát használjanak bizonyos helyeken. A példában a képen látható a homlokzat, a tető, az ég a növényzet és a környező tér. A geometriai modell használatának előnye már első pillantásra szembetűnő: csökkent adatmennyiség, független az időjárástól, információkat tartalmaz az ajtókról, ablakokról, emeletek számáról, stb.

A jövő

A fejlődés a jövő generációjára nagy hatással lesz. A kialakulóban lévő „Tárgyak Internete" követni fog mindenkit és mindent beépített miniatűr RFID chipekkel, és információt fog közölni, helyzetükről az interneten, minden időben, minden helyen, a világ bármely pontjáról hozzáférhetően.

Ahhoz hogy ennek értelme legyen, szükség van egy modellezett világra az interneten, hogy meg lehessen jeleníteni a helyét a milliárdnyi objektum közül bármelyiknek. Ha a világot 2d-ben 4 színsávon 15cm pixel mérettel, a lakott területeket 3d-ben 10cm-es pixel mérettel, ha az utcaképeket 2cm-es pixelekkel és a belső tereket 0.5cm-essel modellezzük, 10-es redundancia faktorral, akkor egy 1 Exabyte-os adatbázist kapunk.

Jelenleg még nem tisztázott, hogy az adatokat hogyan szerzik és frissítik egy ilyen rendszernél, milyen szintig van szükség egy központosított, rendszerezett adatgyűjtésre, és milyen szinttől lehet a további adatgyűjtést wikipedia-szerűen a felhasználók milliárdjaira bízni. Ami viszont már világos, hogy mindenki, aki hasonló rendszert tervez, nagyban támaszkodik a felhasználókra, mint adatgyűjtőkre, és mint minőségellenőrökre.