Category: компьютерное зрение

Machine Learning at the edge

Few learnings on migrating computer vision pipeline from python prototype at AWS to cpp in smartphones One of the projects that we have been working was Smart Mirror – we want to build a technology that will hint user how to looks better at the photo. It has bunch of fascinating tasks to tackles – …

Continue reading

How to convert png pair of RGB and Depth frames into Pointcloud library PCD format

There are a lot of accessible dataset of RGB-D data: http://vision.in.tum.de/data/datasets/rgbd-dataset http://rgbd-dataset.cs.washington.edu/dataset.html http://research.microsoft.com/en-us/projects/7-scenes/ http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/ But usually it stored in PNG format and unfortunately Pointcloud library do not provide built-in function neither for treating it as a PointCloud nor for conversion it to PCD. For my experiments I need to test few points using data with …

Continue reading

Практическое введение в компьютерное зрение

компьютерное зрение - сплошь математика

Компьютерное зрение?! Итак, вы поддались веянию времени и задумали освоить компьютерное зрение. Спешу вас разочаровать – до вечера не управитесь. Однако, примерно представить себе что это вообще такое и с какой стороны подходить к изучению, пожалуй, сможете. Компьютерное зрение (иногда его величают машинным) – это набор технологий и алгоритмов из уймы связанных и не очень …

Continue reading

01 – изображение в компьютерном зрении

пример ортографической проекции

Что такое изображение? Изображение – результат преобразования трехмерного пространства в двумерное. Каждый пиксель изображения – величина отраженного сценой светом в направлении камеры (есть и другие типы – MRI, рентгеновское излучение, изображения получаемые со всяких хитрых штуковин). На практике рассматривают два основных вида преобразований: Перспективная проекция (perspective projection) – вы сами создавали такие проекции с помощью …

Continue reading

02 – (пред)обработка изображений

Мона Лиза - все как в тумане - когда не хватает резкости

Обработка изображений Основная причина обработки изображения – сделать его “лучше” с точки зрения человека. Или компьютера. Этот вот обтекаемый термин – “лучше” – может означать что угодно – контрастнее, четче, скрыть неугодные родинки на лице неудачной фотографии или выделить все границы на изображении. Все методы предобработки изображений объединяет одна особенность – на вход они получают …

Continue reading

03 – features – локальные особенности – за что зацепиться взгляду

преобразование - сдвиг

[pullquote align=”left|top” textalign=”center” width=”30%”]Лучше один раз увидеть…[/pullquote] Local features – локальные особенности Изображение, бесспорно, представляет собой самое емкое и лаконичное представление большего объема “нефильтрованной” информации. Нефильтрованной, потому как в большинстве случаев, в рамках определенной задачи, нам вполне достаточно некоей “выжимки” данных: есть на изображении объект интереса или нет, где он расположен, каковы его характеристики. Эпическое …

Continue reading

05 – машинное обучение для классификации изображений

Машинное обучение – для компьютерного зрения А я предупреждал. В самой еще вводной статье. В компьютерном зрении от компьютера на самом деле очень мало. Пожалуй, только то, что вся эта около-математическая начинка крутится на них, охотно пожирая гигабайты и гигагерцы. Данная статья очередное тому подтверждение. Здесь мы затронем такую щекотливую тему как методы обучения классификаторов …

Continue reading

04 – поиск преобразования между особыми точками и немного моделирования

Сопоставление изображений В интернетах гуляет немало фотографий эйфелевой башни. Одни из них сделаны спозаранку, другие – когда уже вечерело, одни сделаны чуть ли не у ее подножия, на других она высится над Парижем. Однако наш острый ум ни на секунду не сомневается, что во всех случаях это именно она – Эйфелева башня. Что же позволяет …

Continue reading

SLAM – принципы и ссылки на open source

Что такое SLAM? Эта заметка – небольшая памятка на тему что такое SLAM. Здесь описаны основные принципы наиболее популярных методов SLAM (EKF, iSam, TORO и др). В отдельном разделе интересующиеся могут найти ссылки на свободные(!) реализации различных методов SLAM в виде готовых библиотек. А также перечислены блоги и проекты посвященные задаче SLAM. Если вы ищите …

Continue reading

Как работает Kintinious: визуальная одометрия

Одна из ключевых особенностей Kintinious – стабильная работа методов позиционирования камеры в пространстве. Многие ждут когда же они выложат свой код (дада, они собирались это сделать) но мало кто знает что часть кода вобщем-то и так доступна. В частности, одна из ключевых компонент используемых в их работе – набор методов визуальной одометрии – вполне себе …

Continue reading