Automatikus válogatás, minőségjavítás, anonimizálás - nagy mennyiségből kész, publikálható anyag
Ma már felvételt készíteni nem kihívás. A kihívás az, amikor a projekt végén ott van több ezer fotó vagy órákon át tartó videó, vegyes minőségben, változó fényekkel, és ebből gyorsan kellene stabil, egységes, nézhető végeredmény. Sokszor ráadásul adatvédelmi akadály is van: átsétáló emberek, látszó rendszámok, érzékeny részletek - így a nyersanyag nem tehető ki webre, nem küldhető ügyfélnek, nem használható referenciának.
A Mesterséges Intelligencia ide is elért.
A gyorsitottfelvetel.hu-nál erre építettünk fel egy korszerű, automatizált feldolgozási folyamatot: AI-asszisztált kép- és videófeldolgozás timelapse-hez és normál videóhoz is. A cél nálunk nem "egy gyors export", hanem késztermék: olyan anyag, amit meg lehet osztani, be lehet tenni prezentációba, fel lehet használni marketinghez vagy projekt-riporthoz.
És ami a legfontosabb: bármivel jöhet hozzánk.
Nem feltétel, hogy nálunk készüljön a felvétel, és nem csak timelapse kamerabérlésről van szó.
Bér képfeldolgozást és bér videófeldolgozást is vállalunk, hozott anyagból is.
A MI nálunk nem díszszó. Ott használjuk, ahol a mennyiség vagy a feladat jellege miatt a kézi utómunka már nem életszerű. Tipikusan ilyenek:
A végeredmény szempontjából ez azért fontos, mert az AI-tól nem "csodát" várunk, hanem kiszámítható minőséget és automatizálható lépéseket: ugyanaz a minőségi szint nagy mennyiségnél is, gyorsan.
Sokan azzal jönnek, hogy "van egy mappa több ezer képpel, de fogalmam sincs, mi legyen belőle". Másoknak a timelapse elkészült, csak "valahogy nem jó nézni": villog, remeg, szétesik a képi világ. Gyakori az is, hogy a projektanyagban emberek és rendszámok látszanak, ezért nem merik publikálni.
Mi ezekre nem ad-hoc módon reagálunk, hanem egy komplett feldolgozási lánccal:
A "jó timelapse" nem egyetlen trükk eredménye, hanem több egymásra épülő lépésé. A feldolgozásunk ezért pipeline-szerű: az anyagot először "felmérjük", majd a hibákat célzottan korrigáljuk, végül a megfelelő kimenetekre optimalizáljuk.
Nagy mennyiségnél az első döntő lépés: a rossz képek ne kerüljenek be a videóba. Ezt több jelből lehet megbízhatóan megállapítani:
Ezekből a rendszer képes rangsorolni és szűrni, így a videó alapanyaga eleve tisztább és "nézhetőbb" lesz.
A villogás általában abból ered, hogy képről képre minimálisan változik az expozíció, a fehéregyensúly vagy a kontraszt. Feldolgozásban ezt úgy kezeljük, hogy:
A cél, hogy a néző a változást a projektben lássa, ne a kamera "ingadozását".
Timelapse-nél a legkisebb mozgás is felnagyítva látszik. Stabilizálásnál a képek közötti elmozdulást becsüljük, majd korrigáljuk, hogy a kép "helyén maradjon". Ez különösen hasznos:
Gyenge fényben a zajosodás és a részletvesztés gyakori. Itt az elvünk: természetes kép, de használható minőség. Tipikusan:
Videónál két tipikus igény van: (1) gyorsított timelapse jellegű anyag, (2) rövid, tömör összefoglaló. Ennek műszaki oldala többek között:
Ha nincs megbízható időbélyeg (EXIF dátum hiányzik, fájlnévben nincs idő, a fájl dátumai kevertek), akkor is lehet robusztusan nappal/éjszaka bontást csinálni vizuális jelek alapján:
Ezekből nem "egy szabályt" alkalmazunk, hanem több jel együtteséből döntünk, így sokkal kevésbé tévedünk szélsőséges helyzetekben (például erős reflektor nappal, vagy sötét idő nappal).
Ez a hétköznapi felhasználónak az egyik legnehezebb probléma: "itt van 8 000 kép, de nem tudom, mi volt az eleje és mi volt a vége". Ilyenkor több lépcsőben állítjuk helyre a sorrendet:
Ez a gyakorlatban azt jelenti: akkor sem "bukik el" a projekt, ha a nyersanyag rendezetlen vagy hiányos metaadatú.
A legtöbb timelapse és hosszabb videó akkor válik igazán értékessé, amikor publikálható: ki lehet tenni a weboldalra, elküldhető ügyfélnek, beépíthető referenciába, pályázati anyagba vagy projektzáró riportba. A valóságban viszont a nyersanyag gyakran "magánéletbe lóg": átsétál valaki a képen, feltűnik egy rendszám, látszik egy belépőkártya, monitor, irat, vagy egyszerűen olyan részlet, amit nem szeretnél nyilvánosan megmutatni.
Itt szokott elakadni a hétköznapi felhasználó, mert a hagyományos megoldás kíméletlen: képkockáról képkockára kéne kitakarni mindent. Egy timelapse-nél ez több ezer képet jelent, egy hosszú videónál pedig több tízezer képkockát. Ez nem csak időigényes, hanem könnyű benne hibázni is: egyetlen kihagyott pillanat elég, és máris kikerülhet az internetre valami, amit nem szerettél volna.
Ezért építettük be a feldolgozási folyamatba az AI-alapú anonimizálást. A rendszer képes felismerni a tipikus személyes azonosítókat és érzékeny részleteket, és ezekre automatikusan maszkolást alkalmazni - videón és timelapse képsorozaton is. A célunk az, hogy a végeredményből készüljön egy olyan "publikálható verzió", amit nyugodtan meg lehet osztani, miközben a tartalom és az üzenet megmarad.
A gyakorlatban ez többféle helyzetet fed le:
Arcok és személyazonosíthatóság. Építkezésen, telephelyen, üzlethelyiségben, rendezvényen vagy akár egy beltéri átalakításnál előfordul, hogy emberek haladnak át a képen. Timelapse-ben különösen gyakori, hogy valaki csak egy pillanatra látszik - és éppen emiatt a manuális kitakarás a legnehezebb. Az AI felismerés alapján az arcok kitakarhatók (elmosás, pixelesítés vagy maszkolás), és az anonimizálás következetesen végigvihető az anyagon.
Rendszámok és járműazonosítók. Kültéri helyszíneken, parkolókban, kapubejáróknál, utcára néző kameráknál a rendszám megjelenése szinte elkerülhetetlen. Ha a videó marketinganyag, referencia vagy weboldalra kerül, a rendszámok kitakarása sok esetben eleve elvárás. A felismerés és a maszkolás automatizálható, így nem azon múlik a publikálhatóság, hogy valaki végignéz-e több órányi anyagot.
Érzékeny területek fix kitakarása. Nem minden "probléma" mozgó objektum. Gyakori, hogy van a képben egy olyan rész, amit mindig takarni kell: szomszéd telek, ablak, belső tér egy része, monitor, beléptető, recepciós pult, dokumentumok, vagy akár egy olyan sarok, ahol üzleti szempontból nem szeretnél részleteket mutatni. Ilyenkor a megoldás a tartós, kijelölt maszkolás: beállítjuk a takarandó zónát, és az a teljes anyagon következetesen kitakarva marad.
A "publikálható verzió" mint külön kimenet. Sok projektben érdemes kétféle átadást kérni: egy belső, teljes részletességű dokumentációs verziót, és egy publikus, anonimizált változatot. Így a projekt bizonyító ereje, dokumentációs értéke megmarad, de a nyilvános megosztás nem hordoz felesleges kockázatot.
Ha egy anyag villog, remeg, zajos, és közben arcokat/rendszámokat is kell takarni, a végeredmény akkor lesz igazán "iparági standard", ha minden lépés egy munkafolyamatba illeszkedik: válogatás, stabilizálás, egységesítés, anonimizálás, export.
Ezt a teljes láncot tudjuk biztosítani - nagy mennyiségnél is.
A csomagok tájékoztató jellegűek, szolgáltatásunk azért ennél sokkal rugalmasabb.
Nagy mennyiségből automatikus kimenet: válogatás, sűrítés, egységesítés.
Ideális belső riporthoz, ügyfélbemutatóhoz.
Teljes minőség-lánc: egységes képi világ, problémás szakaszok célzott javítása.
Rövidebb, hosszabb, célra optimalizált exportokkal.
A Pro csomag + arc/rendszám/érzékeny területek maszkolása.
Olyan helyszínekre, ahol forgalom van, vagy nyilvános felhasználás a cél.
Több projekt, több helyszín, rendszeres anyaggyártás.
Standardizált workflow, rendszeres kimenetek, adatkezelési rend, igény esetén NDA.
Ilyenkor több lépésben állítjuk helyre a sorrendet: ahol lehet, metaadatból és mintázatokból dolgozunk; ha nincs, képtartalom-alapú rendezést és nappal/éjszaka detektálást alkalmazunk, majd próbakimenettel ellenőrizzük.
Igen. Videóból is készítünk gyorsított timelapse jellegű anyagot vagy rövid összefoglalót, stabilizálással és egységes képi világgal.
Igen. Nem csak videón, hanem képsorozaton is vállaljuk az AI-alapú felismerést és maszkolást, és adunk külön "publikálható verziót".
Fotóknál a legjobb, ha a teljes mappát adjátok át eredeti felbontásban. Videónál az eredeti fájl a legjobb. Ha nem biztos benne, küldjön mintát, és javaslunk átadási módot.
Igen. Ugyanabból az anyagból tipikusan adunk rövid megosztható verziót és nagyobb minőségű archív/present verziót is.
Kiindulás: több hetes timelapse, több ezer kép, felhősödés és napsütés váltakozása miatt a videó pulzált, a színek "úszkáltak", a végeredmény amatőr hatású lett.
Megoldás: automatikus válogatás a kilógó képek kiszűrésére, majd flicker-csökkentés és képi világ egységesítése. A tempót a tényleges változáshoz igazítottuk, így a "semmi nem történik" részek nem húzták szét a videót.
Eredmény: stabil, nyugodt, ügyfélnek és webre is használható timelapse, több kimenettel (rövid összefoglaló + hosszabb dokumentáció).
Kiindulás: kültéri helyszín, járműforgalom és átsétáló emberek; a megrendelő szeretett volna referencia-videót, de a nyersanyagban arcok és rendszámok látszottak.
Megoldás: AI-alapú anonimizálás: arcok és rendszámok felismerése és maszkolása, valamint egy fix "érzékeny zóna" kitakarása a kép egy részén.
Eredmény: elkészült a publikálható verzió, ami adatvédelmi szempontból vállalható, mégis megmaradt a videó informatív tartalma.
Kiindulás: több ezer kép vegyes forrásból, hiányzó vagy megbízhatatlan timestamp, össze-vissza fájlnevek; a megrendelő nem tudta időrendbe rakni, timelapse-t készíteni belőle.
Megoldás: képtartalom-alapú rendezés és blokkosítás (nappal/éjszaka detektálás), majd minőségszűrés és sűrítés.
Eredmény: logikus, folyamatos timelapse sorrend, nézhető tempóval, egységes képi világgal és kész kimenetekkel.
Van több ezer kép vagy hosszú videó, és kész, publikálható anyagot szeretne belőle? Küldjön egy rövid mintát és írja meg a célt. Javaslunk csomagot, készítünk minta-feldolgozást, és elkészítjük a végleges verziókat.