Technologie

Dotknij twarzy przez Internet

Portret wykonany przy pomocy opisanego systemu. Zdjęcie dzięki uprzejmości prof. Baoxin Li. Copyright © 2011 Nan Li, Zheshen Wang, Jesus Yuriar, Baoxin Li: Computer Science and Engineering, Arizona State University

Ostatnie lata w internecie upływają pod znakiem portali społecznościowych. To tam spędzamy coraz więcej czasu, poświęcając go między innymi na oglądanie zdjęć naszych – nierzadko nigdy nie widzianych w realu – znajomych. Większość z nas nie zastanawia się nawet nad barierą jaką napotykają w takim momencie ludzie niewidomi. Współczesne oprogramowanie potrafi co prawda odczytać na głos poprawnie przygotowaną stronę internetową, tak aby możliwie ułatwić skorzystanie z jej treści. Niestety, przedstawienie osobie niewidomej treści zawartej na zdjęciu to zupełnie inna bajka.

Jedynym zmysłem, który pozwala osobie niewidomej na zapoznanie się z informacją zapisaną w postaci fotografii, jest dotyk. W książkach i czasopismach skierowanych do niewidzących zamieszcza się ilustracje wytłoczone w papierze, które czytelnik może badać opuszkami palców. Proces przetwarzania fotografii do takiej postaci jest żmudny i nie daje się do końca zautomatyzować. Z tego też powodu stosuje się go głównie w publikacjach o stosunkowo dużym nakładzie.

Co ma zatem zrobić osoba korzystająca z internetu, która chciałaby dowiedzieć się jak wyglądają jej internetowi znajomi? Z pomocą przychodzi zespół profesora Baoxin Li z Uniwersytetu Stanowego w Arizonie. Opracował on kompleksowy system pozwalający na wytwarzanie portretów w postaci dotykowej.

Do tworzenia tego systemu przyjęto dwa założenia:

    Po pierwsze, ma on być możliwy do wykorzystania przez osobę niewidomą. Założenie z pozoru oczywiste, jednakże dotychczasowe oprogramowanie wspomagające przetwarzanie obrazów wymagało pracy operatora widzącego.
    Po drugie, ma on pracować w czasie rzeczywistym. Nawet jeżeli obraz transmitowany jest na żywo przez kamerę internetową, system ma być w stanie przetworzyć go na wersję dla niewidomych w stosunkowo krótkim czasie.

Opisany w sprawozdaniu z konferencji Intelligent User Interfaces 2011 system działa w trzech etapach. Pierwszym jest pobranie obrazu do przetworzenia. Nie ma tu nic rewolucyjnego. Po prostu z internetu na dysk naszego komputera trafia fotografia osoby, której twarz chcemy poznać. W chwili obecnej oprogramowanie radzi sobie jedynie z portretami, na których tło jest jednolite. Można jednak przypuszczać, że jego ulepszone wersje będą potrafiły poprawnie sobie radzić także z bardziej urozmaiconymi zdjęciami.

Krok drugi polega na obróbce zdjęcia przez program komputerowy. To tutaj przejawia się właśnie innowacyjność przedstawionego systemu. W pierwszej kolejności algorytm wyszukiwania twarzy stara się określić, gdzie na zdjęciu znajduje się sfotografowana osoba. Następnie, twarz jest modelowana. Na zapisany w pamięci model „uśrednionej” twarzy nanoszone są specyficzne dla danego zdjęcia cechy (np. odległość między oczami, czy też stopień „owalności”). Aby dodatkowo wzbogacić wytworzony obraz, nanosi się na niego kontury wykryte na fotografii (mogą to być na przykład zmarszczki lub biżuteria). W efekcie powstaje cyfrowa reprezentacja portretu, gotowa do wytworzenia obrazu „dotykowego”.

Etap ostatni to znowu nic szczególnie nowego. To po prostu wydrukowanie obrazu na specjalnej drukarce i papierze. Urządzenia takie dostępne są na rynku od dłuższego czasu. Ich działanie opiera się zazwyczaj na podgrzewaniu papieru, na który naniesiono warstwę mikrokapsułek wypełnionych alkoholem. Temperatura powoduje pękanie kapsułek, a wydostający się z nich alkohol sprawia, że papier w danym miejscu puchnie i wybrzusza się. Wydruk z takiej drukarki nadaje się bezpośrednio do odczytania przez osobę niewidomą.

W górnym rzędzie fotografie portretowe dwóch osób. W środkowym rzędzie portrety złożone z linii wykonane na podstawie tych fotografii. Na dole wydruki dotykowe tych portretów "odczytywane" palcami przez osoby badane.

Efekty działania opisanego systemu. W górnym rzędzie zdjęcia poddane obróbce. W środkowym rzędzie: złożone z linii portrety będące wynikiem opisanego algorytmu. W dolnym rzędzie gotowe wydruki. ilustracje dzięki uprzejmości prof. Baoxin Li. Copyright © 2011 Nan Li, Zheshen Wang, Jesus Yuriar, Baoxin Li: Computer Science and Engineering, Arizona State University

Jaka jest skuteczność tego systemu?

Wytworzone wydruki przedstawiono osobom niewidomym, oraz osobom z zasłoniętymi oczami. Większość użytkowników była w stanie poprawnie rozpoznać elementy twarzy (oczy, nos, usta), i określić pozycję (en face, profil) oraz płeć osoby sfotografowanej. Co bardziej przekonywujące, spośród zestawu portretów różnych osób, badani byli w stanie wybrać zdjęcia ukazujące tę samą osobę, nawet jeśli była przestawiona w różnych pozycjach lub jej twarz wyrażała odmienne emocje.

Autorzy systemu mają nadzieję, że w krótkim czasie jego cena będzie na tyle niska, iż będzie powszechnie spotykany przy komputerach osób niewidomych, które w końcu będą mogły dowiedzieć się jak wyglądają ich internetowi znajomi.
ResearchBlogging.org

Więcej informacji:
Zheshen Wang, ., & Baoxin Li, . (2010). A Bayesian Approach to Automated Creation of Tactile Facial Images IEEE Transactions on Multimedia, 12 (4), 233-246 DOI: 10.1109/TMM.2010.2046267
Nan Li, Zheshen Wang, Jesus Yuriar, Baoxin Li (2011). TactileFace: A System for Enabling Access to Face Photos
by Visually-impaired People Proceedings of the 15th international conference on Intelligent user interfaces, 445-446 : 10.1145/1943403.1943491
Print Friendly, PDF & Email

O autorze

Michał Jarosz

Inżynier automatyki i robotyki. Utrzymuje się z projektowania systemów bazodanowych. Dorywczo koordynator badań klinicznych. Członek Association for Computing Machinery. Założyciel i opiekun zespołu obliczeń rozproszonych BOINC@Poland. Na koncie jeden maraton i aspiracje do kolejnych.