How it was possible to read nutritional tables with OCR, Tesseract and a lot of computer vision!

Photo by Obi Onyeador on Unsplash

Some time ago I was immersed in a project that worked with the formation of a data lake of food data, collecting from products in general to the nutritional information of a mass of food, however at a certain point it was realized that most of the nutritional information was inserted in images and not in text, making it difficult to web scrapping with the Scrapy framework and Python.

This problem opened the opportunity to learn something that has been present in technology…

Como foi possível ler tabelas nutricionais com OCR, Tesseract e muita visão computacional!

Photo by Obi Onyeador on Unsplash

Ha um tempo atrás estava imerso em um projeto que trabalhava com a formação de um data lake de dados alimentícios, coletando desde produtos em geral até as informações nutricionais de uma massa de alimentos, todavia em determinado ponto percebeu-se que a maior parte das informações nutricionais estavam inseridas em imagens e não em textos, dificultando, assim, a questão de web scrapping com o framework Scrapy e Python.

Esse problema abriu oportunidade para o aprendizado de algo que está presente na tecnologia há muito tempo e ganhou…

Photo by Christine Roy on Unsplash

Esse texto foi feito a partir da leitura do livro Análise de imagens digitais: princípios, algoritmos e aplicações, escrito por Hélio Pedrini. De forma geral, desejo falar sobre o capítulo 10, que trata sobre o tema Registro de Imagem, focando nas coordenadas.

Na sessão passada comentamos sobre interpolações e formações de imagem, o que está disponível no seguinte link.

Coordenadas

As equações também podem ser representadas através de transformação de matrizes, dessa forma, normalmente utiliza-se coordenadas homogêneas, sendo que elas possuem o valor W que é um valor diferente de zero. …

Photo by Martin Sanchez on Unsplash

Esse texto foi feito a partir da leitura do livro Análise de imagens digitais: princípios, algoritmos e aplicações, escrito por Hélio Pedrini. De forma geral, desejo falar sobre o capítulo 10, que trata sobre o tema Registro de Imagem, focando nas interpolações.

Na sessão passada comentamos sobre transformações, o que está disponível no seguinte link. Todavia, vale ressaltar que as interpolações também estão inseridas nas transformações geográficas, mas o material foi divido para o conteúdo não ficar demasiadamente grande.

Interpolação de Intensidade

Diferente das transformações, as interpolações trabalham com a atribuição de intensidade aos pontos que estão na nova grade da imagem. Essas…

Photo by Manja Vitolic on Unsplash

Esse texto foi feito a partir da leitura do livro Análise de imagens digitais: princípios, algoritmos e aplicações, escrito por Hélio Pedrini. De forma geral, desejo falar sobre o capítulo 10, que trata sobre o tema Registro de Imagem, focando nas transformadas.

Transformadas Geométricas

As transformadas geométricas consistem na aplicação de funções de mapeamento e atribuição de valores dos píxeis de uma imagem partindo de uma imagem original, sendo assim composto por uma transformação espacial e uma interpolação de intensidade. …

Photo by Joanna Nix-Walkup on Unsplash

The Kuwahara filter can be defined as a non-linear smoothing filter that does not compromise the sharpness of the image or the positions of the edges and is traditionally recognized by this second aspect. A large part of the filters used for image smoothing are low-pass filters that effectively reduce noise but also cause blurring of the edges, unlike Kuwahara which preserves them, this being its great differential.

It is one of the pioneering techniques in image filtering with edge preservation, proposed in 1976 had the primitive purpose of assisting in the processing of RI-angiocardiography images of the cardiovascular system…

Photo by Markus Spiske on Unsplash

O filtro de Kuwahara pode ser definido como um filtro não linear de suavização que não compromete a nitidez da imagem ou as posições das bordas, sendo reconhecido tradicionalmente por este segundo aspecto. Uma grande parte dos filtros utilizados para suavização de imagens são passa-baixas que efetivamente reduzem ruídos mas também causam desfoque nas bordas, diferente do Kuwahara que as preserva, sendo este seu grande diferencial.

É uma das técnicas pioneiras na filtragem de imagens com preservação de bordas, proposta em 1976 teve como intuito primitivo auxiliar no processamento de imagens RI-angiocardiografia do sistema cardiovascular por conta da utilidade na…

Python wallpaper
Python wallpaper

Há alguns dias eu estava fazendo um projeto em Python e queria deixá-lo mais prático para quem quisesse acessá-lo, e um dos passos para isso era construir os requirements.txt, que normalmente carrega os pacotes necessários para executar os projetos em Python. A alternativa mais comum é:

  1. visualizar os pacotes no projeto;

2. selecionar os pacotes necessários através de:

$ pip freeze

3. copiar um a um e colar no requirements.txt

Mas isso não é nada prático, então procurei uma alternativa que atendesse minha necessidade, e encontrei um projeto que fazia exatamente isso. Seu objetivo é gerar requirements.txt …

How to make requirements for your project in less than 2 minutes — for both small and large projects.

Photo by Dlanor S on Unsplash

Summary

  • Context;
  • Installation and Usage;
  • Observation;
  • Resources.

Context

The requirements files are used to store the libraries and packages used in a project or, as described in the pip documentation:

“Requirements files” are files containing a list of items to be installed using pip install[…]

Thus, it is extremely common to find these requirements files in Python projects, which are named requirements.txt. The installation of these requirements can be performed easily using a command like the following, or more specifically, using some parameters that can also be found in the pip documentation.

$ pip install -r requirements.txt --user

But, a few days…

Photo by David Travis on Unsplash

OCR é um acrônimo que representa Optical Character Recognition (Reconhecimento ótico de caracteres) e a sua principal motivação foi de reconhecer caracteres a partir de imagens, principalmente, e de mapas de bits, dessa forma, facilitando a manipulação desses caracteres identificados.

Como os estudos dessa tecnologia são uma realidade desde 1950, hoje temos bastante ferramenta que são consolidadas no mercado e gratuitas, inclusive, das quais posso citar:

  1. GORC (http://jocr.sourceforge.net/)

Lucas de Brito Silva

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store