Компютри, Информационни технологии

Модерен компютърно зрение. Задачи и компютърно зрение технология. Програмиране Компютърно зрение в Python

Как да се научи на един компютър, за да се разбере какво е изобразено на снимката или снимките? Това изглежда просто, но за компютър, това е само една матрица, състояща се от нули и единици, от които искате да извлечете важна информация.

Каква е визията за компютъра? Това е способността да "вижда" компютъра си

Vision - е важен източник на информация за лицето, да го използвате, ние получаваме, според различни оценки, 70-90% от цялата информация. И, разбира се, ако искаме да се създаде интелигентна кола, ние трябва да се прилагат едни и същи умения и компютъра.

Проблемът на компютърното зрение може да се каже съвсем ясно. Какво е "вижда"? Разбираемо е, че когато са налице само като се погледне. Това заключи, разликите на компютърното зрение и човешкото зрение. Визия за нас - това е източник на знания за света, както и източник на метрична информация - това е способността да се разбере, разстоянията и размери.

Семантичната изображение ядрото

Гледайки снимката, можем да го опиша с редица качества, така да се каже, да се извлече семантична информация.

Например, погледнете в тази картина, можем да кажем, че е открито. Какво е трафик на града. Това са автомобили. можем да се досетим, че това е Югоизточна Азия от конфигурацията на сградата и йероглифи. Портретът на Мао Цзедун се разбере, че това е в Пекин, и ако някой видя видео на живо или самият е бил там, предполагам, че това е известният площад Тянанмън.

Какво можем да кажем още за картината, като я видят? Можем да определим обекти в картинката, за да се каже, че има хора тук по-близо - ограда. Тук чадъри, плакати, че сградата. Това са примери за упражнения са много важни обекти, които са ангажирани в търсене на момента.

Все още можем да научим някои от функциите или атрибути на обекти. Например, тук можем да определим, че това не е портрет на обикновените китайци, а именно, Мао Цзедун.

Според превозното средство може да се определи, че е движещ се обект, и е трудно, че не се деформира по време на движение. За флагове може да се каже, че той се противопоставя, те са също така се движи, но те не са твърди, постоянно деформиран. И в сцената има вятър, който може да се определи чрез разработване на знамена, и дори може да се определи посоката на вятъра, например, то вятър от ляво на дясно.

Разстоянията и дължини в компютърното зрение

Много важно е метрична информация за компютърно зрение наука. Това е на всички видове разстояния. Например, за марсохода е особено важно, тъй като отборите са от Земята за около 20 минути и отговарят на най-много. Съответно връзката там и обратно - 40 минути. И ако направим план за движение команди на Земята, трябва да се вземе това предвид.

Успешно интегриран технологията на компютърното зрение във видео игри. Според видеото, можете да изградите триизмерни модели от предмети, хора, както и снимки на потребителя, могат да възстановят триизмерните модели на градове. И тогава се ходи по тях.

компютърно зрение - доста широк диапазон. Тя е тясно преплетени с различни други науки. Част от компютърното зрение Той улавя зоната на обработка на изображението, а понякога и разпределя компютърно зрение, исторически.

Анализ, разпознаване на образи - пътят към създаването на по-висш интелект

Нека разгледаме тези понятия поотделно.

Обработка на изображения - това е с площ от алгоритми, в които на входа и изхода - образ, и ние сме го направя нещо.

анализ на изображението - е площта на компютърното зрение, която се фокусира върху работата с двуизмерен образ и да направи изводи от това.

Разпознаване на образи - абстрактна математическа дисциплина, която разпознава данни под формата на вектори. Това означава, че на входа - вектор и ние имаме нещо общо с него. Къде вектора е, че ние не сме толкова важно да се знае.

Компютърно зрение - тя първоначално е била да се възстанови структурата на двуизмерни изображения. Днес тази област е станала по-широка и може да се тълкува като приемане на всички физически обекти правят въз основа на изображението. Това е, това е задачата на изкуствения интелект.

Успоредно с компютърно зрение в съвсем друга област, в геодезията, фотограметрията се разви - измерване на разстоянието между обектите на двуизмерни изображения.

Роботите могат да "виждат"

И най-накрая - това е машинно зрение. Според визията на машината означава визия за роботи. Това е решението на някои производствени проблеми. Можем да кажем, че компютърното зрение - е една голяма наука. Той съчетава някои от другите науки част. И когато визията на компютъра получава всяко конкретно приложение, то се превръща в зрението една машина.

Компютърно зрение област има маса практически приложения. Той е свързан с автоматизацията на производството. В предприятията станат по-ефективни, за да замени ръчен труд от машина. Машината не се уморяват, не спи, тя трябваше нередовен график за работа, тя има желание да работи 365 дни в годината. Така че, с помощта на работата на машината, ние може да получи гарантиран резултат в определено време, и това е доста интересно. Всички задачи имат ясна използване на системи за компютърно зрение. И няма нищо по-добро, отколкото да се видят резултатите веднага върху снимката само в етапа на изчисляване.

На прага на света на изкуствен интелект

Плюс областта - това е трудно! Значителна част от мозъка, които отговарят за зрението, и се смята, че ако ви научи компютъра, за да "виждат", че е, пълното използване на компютър визия, тя е една от целите на пълен изкуствения интелект. Ако можем да решим проблема на човешкото ниво, най-вероятно в същото време, ние ще решим проблема с изкуствен интелект. Това е много добра! Или не е много добра, ако се вгледате, "Терминатор 2".

Защо визия - това е трудно? Тъй като изображението на един и същ обект може да варира значително в зависимост от външни фактори. В зависимост от предмета на наблюдателни пунктове изглеждат по различен начин.

Например, една и съща фигура, взети от различни ъгли. И това, което е най-интересно на фигурата може да бъде едно око, две очи и половина. И в зависимост от контекста (ако това изображение на мъж в риза с боядисани очи), окото може да бъде повече от два.

Компютърът все още не разбира, но тя "вижда"

Друг фактор, който затруднява - това е осветлението. В една и съща сцена с различни осветление ще изглеждат по различен начин. размер обект може да варира. Освен това, обектите на всеки клас. Как може да се каже за един човек, който му височина от 2 метра? Нищо. Човешки растеж и може да бъде 2.3 m и 80 см. Както и при други видове предмети, обаче, са обекти от същия клас.

Особено, живеещи обекти са подложени на различни щамове. Коса хора, спортисти, животни. Вижте снимки на коне, когато тичат, да определи какво се случва с техните гривата и опашката е просто невъзможно. А припокриващи се обекти в изображение? Ако бутам компютър образ, дори и най-мощната машина намерите трудност да се даде правилното решение.

Следващ изглед - това е прикритие. Някои обекти, животни, които се преправят на околната среда, както и доста умело. И същите петна и оцветяване. Въпреки това, ние ги виждаме, макар и не винаги отдалеч.

Друг проблем - движението. Обекти в движение невъобразим претърпяват деформация.

Много от обектите са много променлива. Ето, например, в двете снимките по-долу в предмета на дейност на "стола".

И на тази можете да седнете. Но за да научи една машина, като че различните неща в форма, цвят, материал, всичко е обект "стол" - е много трудно. Това е предизвикателството. За да се интегрира методи за компютърно зрение - е да научи една машина да се разбере, анализира, се спекулира.

Интеграция на компютърното зрение в различни платформи

Масата на компютърното зрение започна да прониква повече през 2001 г., когато той създава първата детектора лице. Виола, Джоунс: Ние го двама автори направи. Това е първата бърза и надеждна достатъчно алгоритъм, който демонстрира силата на методи за машинно обучение.

Сега компютърно зрение имат достатъчно нови практически приложения - признаване на човешкото лице.

Но да се признае на мъжа като по филмите - на случаен принцип ъгли, различни светлинни условия - това е невъзможно. Но за да се реши проблема, или този, който е различни хора с различни осветление или в друга поза, подобно като на снимката в паспорта, възможно е с висока степен на доверие.

на изискванията за паспортна снимка до голяма степен се дължи на функцията на алгоритми за разпознаване на лица.

Например, ако имате биометричен паспорт, в някои съвременни летища, можете да използвате автоматичната система за паспортен контрол.

Нерешен проблем на компютърното зрение - способността да се признае всеки текст

Може би някой използва OCR система. Един от тях - с глоба Reader, е много популярен в RuNet система. Има много форми, където можете да попълнят данните, те са напълно сканирани, информацията се разпознават от системата много добре. Но с всеки текст от картинката ситуацията е много по-зле. Този проблем все още остава нерешен.

Игри с участието на компютърното зрение, за улавяне на движение

Отделно голяма площ - е създаването на триизмерни модели и улавяне на движение (което е доста успешно в компютърни игри). Първата програма, която използва компютърно зрение - система за взаимодействие с компютъра чрез жестове. Когато той е създаден, че е много неща отворени.

Алгоритъмът е предназначена съвсем просто, но, за да изберете отне да се създаде генератор на синтетични изображения на хора, за да получите един милион снимки. Суперкомпютър с тях, за да изберете параметрите на алгоритъма, за които той сега работи добре.

Това е един милион изображения и седмица време е възможно броим суперкомпютър за създаване на алгоритъм, който консумира 12% от капацитета на един процесор и позволява на човек да възприема позицията в реално време. Тази система на Microsoft Kinect (2010).

Търсене на снимки по съдържание ви позволява да качвате снимки на системата, както и резултатите от него ще дадат всички снимки със същото съдържание и изработени от един и същи ъгъл.

Примери за компютърно зрение: триизмерни и двуизмерни карти в момента се правят с него. Карти за навигация автомобили се актуализират редовно в съответствие с DVR.

Има една база данни с милиарди снимки с географски маркери. С изтеглянето на снимката в базата данни, може да се определи къде е направена, и дори с някои перспектива. Разбира се, при условие, че мястото е достатъчно популярен в един момент на туристите и направи няколко снимки на района са били там.

роботи са навсякъде

Роботика в настоящия момент, навсякъде, без да го по някакъв начин. Сега там са превозни средства, които имат специални камери, които разпознават пешеходци и пътни знаци за предаване на команди на водача (това по начин, компютърна програма, за да видите, помага на шофьор). И там е напълно автоматизирана роботизирани превозни средства, но те не могат да разчитат единствено на системата за видео камера без използването на голямо количество допълнителна информация.

Модерен камера - това е обскура аналогов фотоапарат

Нека поговорим за цифрови изображения. Съвременните цифрови фотоапарати са подредени на принципа на Камера обскура. Само вместо отвора, през които светлината влиза в гредата и се проектира върху задната стена на камерата на тема верига, ние имаме специална оптична система, наречена обектива. Нейната цел е да събира голям светлинен лъч и го преобразува така, че всички лъчите преминават през виртуална точка, за да се получи и формата на изображение върху филм или матрица.

Съвременните цифрови фотоапарати (матрица) се състои от отделни елементи - пиксела. Всеки пиксел може да измерва енергията на светлината, която е инцидент на общия брой на пикселите, и издава един изход номер. Ето защо, в един цифров фотоапарат, ще получите вместо яркост на изображението комплект светлинни измервания, уловени в един пиксел - на компютъра зрителното поле. Ето защо, когато изображението, което виждаме не е течаща линии и ясни контури, както и мрежа от цветни квадратчета в различни цветове - пиксела.

По-долу виждате първият цифров образ в света.

Но в тази картина не е? Цвят. Какво е цвят?

Психологически възприятие на цветовете

Цвят - това е това, което виждаме. Цветът на този, и едно и също нещо за хората и котки ще бъде различен. Тъй като ние (хората) и животински оптична система - визията е различна. Ето защо, цвят - това е психологически качеството на нашата визия, която се проявява, когато наблюдавате обекти и светлина. И не на физическа собственост на обекта и светлината. Цвят - е резултат от взаимодействието на леки компоненти, както и мястото на визуалната ни система.

Програмиране Компютърно зрение в Python, използвайки библиотеки

Ако сте решили да се ангажират сериозно в изучаването на компютърното зрение, трябва незабавно да се подготвят за редица трудности, тази наука не е най-лесният и скрива редица капани. Но "Програмиране Компютърно зрение на Python" авторството на Ян Ерик Solema - книга, която описва всички най-прост език. Тук ще се запознаете с методите на разпознаване на различни обекти в 3D, да се научат да работят с стерео образа, виртуалната реалност и много други приложения на компютърното зрение. В книгата са достатъчни примери в Python. Но обясненията са представени, така да се каже, обобщени, за да не се претовари прекалено много изследвания и суровите данни. Работа подходяща за студенти, любители и ентусиасти. Изтегляне на тази книга и на другите за компютърно зрение (PDF-формат) може да бъде в мрежата.

В момента има библиотека отворен код на компютърно зрение алгоритми и обработка на изображения и цифрови алгоритми OpenCV. Тя се осъществява на най-съвременни езици за програмиране, е с отворен код. Ако говорим за компютърно зрение, Python използва като език за програмиране, тя също така има подкрепата на библиотеката, в допълнение, тя се развива постоянно и има голяма общност.

Компанията "Майкрософт" предлага услугите си и Api-способни да се обучават невронната мрежа да работи с изображения на хора. Налице е също така възможност да кандидатстват компютърно зрение, Python използва като език за програмиране.

Компютри, Информационни технологии

Модерен компютърно зрение. Задачи и компютърно зрение технология. Програмиране Компютърно зрение в Python

Каква е визията за компютъра? Това е способността да "вижда" компютъра си

Семантичната изображение ядрото

Разстоянията и дължини в компютърното зрение

Анализ, разпознаване на образи - пътят към създаването на по-висш интелект

Роботите могат да "виждат"

На прага на света на изкуствен интелект

Компютърът все още не разбира, но тя "вижда"

Интеграция на компютърното зрение в различни платформи

Нерешен проблем на компютърното зрение - способността да се признае всеки текст

Игри с участието на компютърното зрение, за улавяне на движение

роботи са навсякъде

Модерен камера - това е обскура аналогов фотоапарат

Психологически възприятие на цветовете

Програмиране Компютърно зрение в Python, използвайки библиотеки

Similar articles

Компютри

Компютри

Компютри

Компютри

Компютри

Компютри

Trending Now

Компютри

Красота

Финанси

Пътуване

Изкуства и развлечения

Здраве

Newest

Компютри

Хоби

Новини и общество

Здраве

Отношения

Здраве