Расположение текста в пределах изображения

голоса
25

Сейчас я работаю над проектом, и моя цель состоит в том, чтобы найти текст на изображении. OCR'ing текст не мое намерение до сих пор. Я хочу, чтобы в основном получить границы текста внутри изображения. Я использую AForge.NET компонент изображений для манипуляций. Любая помощь в том или ином смысле?

Обновление 2/5/09: я с тех пор пошел вдоль другой маршрут в моем проекте. Однако я попытаться получить текст с помощью MODI (Microsoft Office Document Imaging). Это позволяет OCR изображение и вытащить текст из него с некоторой легкостью.

Задан 05/08/2008 в 04:04
источник пользователем
На других языках...                            


4 ответов

голоса
12

Это активная область исследований. Есть буквально куча научных работ по данной теме. Это будет трудно дать вам помощь особенно без более deatails. Вы ищете конкретные типы текста? Шрифты? Только английский? Знакомы ли вы с научной литературой?

«Обнаружение текста» является стандартной проблемой в любой системе OCR (оптическое распознавание символов) и, следовательно, есть много битов кода на межсетях, которые имеют дело с ним.

Я мог бы начать листинг кучи ссылок с Google, но я предлагаю вам просто сделать поиск «текст обнаружения» и начать чтение :). Существует множество примеров кода также доступны.

Ответил 05/08/2008 d 04:24
источник пользователем

голоса
3

распознавания текста внутри изображения действительно горячая тема для исследователей в этой области, но только начали расти из -под контроля , когда для CAPTCHA стало «нормой» с точки зрения защиты от спам - ботов. Зачем использовать капчи в качестве защиты? а потому , что это / было очень трудно найти (и читать) текст внутри изображения!

Причина, почему я упоминаю для CAPTCHA потому, что большинство продвижения * производятся в пределах этой маленькой области, и я думаю, что ваше решение может быть лучше всего найти там. особенно потому, что для CAPTCHA действительно о поиске текста (или что-то похожее на текст) внутри суматоху изображения, а затем пытается правильно читать письма.

так что если вы можете найти себе хороший инструмент с открытым исходным кодом CAPTCHA , нарушение вы , вероятно , есть все , что вам нужно , чтобы продолжить поиски ...
Вы могли бы даже выбросить самый dificult код , который обрабатывает распознавание символов сам, потому что эти OCR, используются для чтения искаженный текст, то , что вы не должны делать.

*: Продвижение с точки зрения видимого, полезной и практической информации для «не-исследователя»

Ответил 05/08/2008 d 07:00
источник пользователем

голоса
0

Ширина линии преобразования может сделать это для вас. Это , по крайней мере , что MS разработан для мобильного телефона OS. Обсуждение на реализации находится здесь https://stackoverflow.com/

Ответил 19/04/2013 d 15:54
источник пользователем

голоса
0

Если вы хорошо с помощью онлайн API для этого API на http://www.wisetrend.com/wisetrend_ocr_cloud.shtml может сделать обнаружение текста в дополнение к только OCR.

Ответил 23/06/2010 d 06:49
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more