Распознавание простой капчи (capcha)

Author Роман Чернышов    Category PHP     Tags Комментариев 0 Дата 26 Апр

Часто встречающаяся задача, распознать текст или код с картинки с помощью скрипта, для дальнейшего автоматизирования процесса распознания. Например такой скрипт может быть полезен для распознания кода капчи(capcha) при регистрации на каком либо сайте или отправке сообщения. Я же реализовал данный скрипт для распознавания пользовательский данных выводимых в профиле, данные выводятся в виде картинок. Речь идет о емаил и номере телефона. Вывод в виде картинок используется с целью предотвращения копирования этих данных.

По существу, этот скрипт можно использовать для распознавания любых символов изображенных на картинке. Но весьма простой картинке.

Принцип работы крайне прост, и состоит из следующих этапов:
1. У нас есть картинка с кодом или номером телефона, например —
2. Мы разбиваем картинку на пиксели и каждый пиксель загружаем в двумерный массив X,Y. Светлые(белые) пиксели имеют значение 0, темные(черные) значение 1. Если картинка цветная, то следует преобразовать ее в черно-белую.
Массив будет выглядеть следующим образом

3. Создаем эталонный массив содержащий значения известных нам символов.
Пример, символ цифра «5»:

4. Далее сравниваем массив значений полученный из картинки с эталонным массивом содержащим значение символов, букв, цифр. При обнаружении совпадений двух массивов констатируем успешность распознавания символа. Точность совпадения можно регулировать, не обязательно она должна быть 100%. Нужно учитывать шум картинки, недостающие или избыточные пиксели.

Пример работы скрипта http://rche.ru/parser/opencapche.php

Скачать исходники скрипта http://rche.ru/upload.php?id=6

О том как создать свой собственный сайт с ноля пошагово, читайте в блоге посвященному данной теме.

Оставить комментарий

Консультации

Последние вопросы
Меню

Archive

Качественный хостинг сайтов CMS Для сайта услуг хостинга