tess4j: OCR desde Java de forma sencilla

Tess4J es una librería Java open-source con licencia Apache, que actúa como Wrapper JNA para la librería OCR open-source Tesseract.

Usarla es muy sencilla, veamos un ejemplo.

Primero creamos un proyecto Maven con el arquetipo quickstart.

mvn archetype:generate -DgroupId=com.indracompany.examples.tess4j -DartifactId=tess4j-example -DarchetypeArtifactId=maven-archetype-quickstart -DinteractiveMode=false

Luego añado a mi pom.xml:

<dependency>

<groupId>net.sourceforge.tess4j</groupId>

<artifactId>tess4j</artifactId>

<version>3.2.1</version>

</dependency>

Y genero el proyecto de Eclipse con >mvn eclipse:eclipse:

Luego en https://github.com/tesseract-ocr/tessdata descargaré los datos entrenados para los lenguajes que me interesen:

· Inglés à https://github.com/tesseract-ocr/tessdata/blob/master/eng.traineddata

· Español à https://github.com/tesseract-ocr/tessdata/blob/master/spa_old.traineddata (bajaros este y renombradlo a spa.traineddata.

Luego en mi proyecto creo la carpeta tessdata donde dejo los ficheros traineddata descargados:

Para acabar creo una carpeta images y dejo la imagen/imágenes de las que quiero hacer OCR:

(en mi caso con la extensión de Chrome Full Page Screen Capture he generado como imagen la web principal de elmundo.es):

Para acabar en la clase Java App.java que ha generado Maven dejo este código:

Si ejecutamos el código obtendré algo como esto:

Si me fijo en el texto de este banner que compone la imagen:

Podemos ver como el OCR ha obtenido:

Podemos probar a usar el lenguaje por defecto (inglés), con comentar esta línea:

en este caso habríamos obtenido:

tess4j y su librería OCR Tesseract puede configurarse y entrenarse para obtener mejores resultados (pero eso es otro post 🙂 ).

Publicado en Java. Leave a Comment »

10 tendencias que cambiarán tu manera de trabajar (I/II)

¿Y en vuestra empresa cumplen estas tendencias?

Sodexo ha tomado como referencia su experiencia trabajando con más de 10.000 compañías repartidas en 80 países. Las universidades de Columbia y de Harvard, Accenture, McKinsey, LinkedIn o la Federación Internacional de Robótica, entre otros, han colaborado con la multinacional en la elaboración de 2017 Global Workplace Trends, una investigación que se ha completado con 55 horas de entrevistas.

A partir de ahí ha detectado diez tendencias que marcarán el ritmo de trabajo y cambiarán nuestra vida laboral:

1. Agilidad

Se habla de la compañía celular, es decir, un organismo vivo integrado por células autónomas con espíritu de colaboración y en amistosa competencia, que unen sus fuerzas cuando es necesario.

Estamos ante el espíritu startup que alimenta a las empresas que arrancan. Los profesionales saben que tienen que ser ágiles en su trabajo y estar preparados para reaccionar ante imprevistos, es su único salvavidas.

2.Colaboración

Este afán por sacar el máximo partido de los profesionales se refleja en el diseño de las oficinas, en las que se comparte espacio y recursos y se favorecen las interacciones para la resolución de problemas combinando puntos fuertes para abordar cuestiones complejas. Es lo que los expertos definen como lugares de trabajo cruzados que fomentan la creatividad y la innovación.

Es lo que se denomina polinización cruzada -cross pollination- en la que coinciden disciplinas, habilidades, distintas generaciones y el background de cada empleado, un puzle del que surge la innovación que requiere el mercado y que las organizaciones puede fomentar a través de la escucha, la curiosidad, el pensamiento lateral y la creencia de que cualquiera puede innovar.

3.Design Thinking

Es el nuevo mantra de los profesionales y de los empleadores, una metodología de trabajo dirigida a fomentar la innovación en las organizaciones de una forma eficaz y con éxito.

Se trata de poner al empleado en el centro de todo. Más allá de construir un entorno laboral agradable, la tecnología y las posibilidades de trabajar en un entorno virtual, centrarse en el empleado implica un nuevo diseño de la organización que contemple formación y desarrollo, una política de recompensas y la gestión del desempeño.

Más allá de instalar un futbolín o un tobogán en el centro de trabajo, tiene que ver con crear un ambiente en el que el diseño del interior -facility management- esté alineado con políticas de recursos humanos que impacten en la plantilla.

4.Sin fronteras

La reubicación de los trabajadores y los flujos migratorios suponen un cambio inevitable en las organizaciones.

Las empresas tienen la responsabilidad de invertir en el desarrollo de esas habilidades, comenzando por el idioma, y en la integración de ese talento: una mano de obra diversa, experta y comprometida es clave para aumentar la competitividad.

5.Robótica

Los avances de la inteligencia artificial han hecho que algunos robots realicen trabajos que solían hacer los humanos. El desafío al que se enfrentan las organizaciones es explorar este éxito, especialmente cuando colaboran con profesionales en actividades exclusivamente humanas.

Gudrun Litzenberger, secretario general de la Federación Internacional de Robótica, afirma que "muchas personas manifiestan su ansiedad al pensar en los robots, pero en 2030 los aceptarán y comprobarán cómo hacen la vida más sencilla y productiva"

Humor: Cuando intento hacer una mejora en un proyecto legacy

Publicado en Humor. Leave a Comment »

DZone Refcardz Core Python

Humor: Probando un API supersuper RESTFul pero sin documentación

Publicado en Humor. Leave a Comment »

Humor: Cuando me fijo en la hora que es y veo las reuniones que me quedan

Humor: No hay problemas, sólo soluciones

A %d blogueros les gusta esto: