Few learnings on migrating computer vision pipeline from python prototype at AWS to cpp in smartphones One of the projects that we have been working was Smart Mirror – we want to build a technology that will hint user how to looks better at the photo. It has bunch of fascinating tasks to tackles – …
Category: компьютерное зрение
Sep 24
How to convert png pair of RGB and Depth frames into Pointcloud library PCD format
There are a lot of accessible dataset of RGB-D data: http://vision.in.tum.de/data/datasets/rgbd-dataset http://rgbd-dataset.cs.washington.edu/dataset.html http://research.microsoft.com/en-us/projects/7-scenes/ http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/ But usually it stored in PNG format and unfortunately Pointcloud library do not provide built-in function neither for treating it as a PointCloud nor for conversion it to PCD. For my experiments I need to test few points using data with …
May 03
Практическое введение в компьютерное зрение
Компьютерное зрение?! Итак, вы поддались веянию времени и задумали освоить компьютерное зрение. Спешу вас разочаровать – до вечера не управитесь. Однако, примерно представить себе что это вообще такое и с какой стороны подходить к изучению, пожалуй, сможете. Компьютерное зрение (иногда его величают машинным) – это набор технологий и алгоритмов из уймы связанных и не очень …
May 03
01 – изображение в компьютерном зрении
Что такое изображение? Изображение – результат преобразования трехмерного пространства в двумерное. Каждый пиксель изображения – величина отраженного сценой светом в направлении камеры (есть и другие типы – MRI, рентгеновское излучение, изображения получаемые со всяких хитрых штуковин). На практике рассматривают два основных вида преобразований: Перспективная проекция (perspective projection) – вы сами создавали такие проекции с помощью …
May 03
02 – (пред)обработка изображений
Обработка изображений Основная причина обработки изображения – сделать его “лучше” с точки зрения человека. Или компьютера. Этот вот обтекаемый термин – “лучше” – может означать что угодно – контрастнее, четче, скрыть неугодные родинки на лице неудачной фотографии или выделить все границы на изображении. Все методы предобработки изображений объединяет одна особенность – на вход они получают …
May 03
03 – features – локальные особенности – за что зацепиться взгляду
[pullquote align=”left|top” textalign=”center” width=”30%”]Лучше один раз увидеть…[/pullquote] Local features – локальные особенности Изображение, бесспорно, представляет собой самое емкое и лаконичное представление большего объема “нефильтрованной” информации. Нефильтрованной, потому как в большинстве случаев, в рамках определенной задачи, нам вполне достаточно некоей “выжимки” данных: есть на изображении объект интереса или нет, где он расположен, каковы его характеристики. Эпическое …
May 03
05 – машинное обучение для классификации изображений
Машинное обучение – для компьютерного зрения А я предупреждал. В самой еще вводной статье. В компьютерном зрении от компьютера на самом деле очень мало. Пожалуй, только то, что вся эта около-математическая начинка крутится на них, охотно пожирая гигабайты и гигагерцы. Данная статья очередное тому подтверждение. Здесь мы затронем такую щекотливую тему как методы обучения классификаторов …
May 03
04 – поиск преобразования между особыми точками и немного моделирования
Сопоставление изображений В интернетах гуляет немало фотографий эйфелевой башни. Одни из них сделаны спозаранку, другие – когда уже вечерело, одни сделаны чуть ли не у ее подножия, на других она высится над Парижем. Однако наш острый ум ни на секунду не сомневается, что во всех случаях это именно она – Эйфелева башня. Что же позволяет …
Jan 04
SLAM – принципы и ссылки на open source
Что такое SLAM? Эта заметка – небольшая памятка на тему что такое SLAM. Здесь описаны основные принципы наиболее популярных методов SLAM (EKF, iSam, TORO и др). В отдельном разделе интересующиеся могут найти ссылки на свободные(!) реализации различных методов SLAM в виде готовых библиотек. А также перечислены блоги и проекты посвященные задаче SLAM. Если вы ищите …
Sep 20
Как работает Kintinious: визуальная одометрия
Одна из ключевых особенностей Kintinious – стабильная работа методов позиционирования камеры в пространстве. Многие ждут когда же они выложат свой код (дада, они собирались это сделать) но мало кто знает что часть кода вобщем-то и так доступна. В частности, одна из ключевых компонент используемых в их работе – набор методов визуальной одометрии – вполне себе …
- 1
- 2