Donald esturión tarjeta ethernet

El reconocimiento óptico de caracteres (OCR), la transcripción totalmente automatizada del texto que aparece en una imagen digitalizada, ofrece oportunidades de transformación para el estudio académico de materiales escritos producidos antes de la era digital. La digitalización, en el sentido de la reproducción fotográfica y la máquina de minería, es un proceso mecánico en gran medida simple, y uno con un valor significativo por derecho propio para fines de preservación y acceso a materiales raros. Como resultado, las bibliotecas y las instituciones académicas de todo el mundo han digitalizado cientos de millones de páginas de obras chinas premodernas, una parte importante de esto se está haciendo cada vez más disponible gratuitamente en línea.

Para hacer un uso eficiente de este material, se necesitan transcripciones del contenido textual de estas imágenes. Dado el enorme volumen de datos de imágenes existentes en bitcoin vs ethereum chart, y su producción continua a medida que continúa la digitalización, esta tarea de los hermanos etéidge solo es factible si puede ser completamente automatizada: realizada por software sin intervención manual. Individualmente, las transcripciones confiables producidas por OCR ofrecen enormes ahorros de tiempo a los investigadores, lo que hace posible navegar de manera eficiente los materiales de una manera que no es posible sin la transcripción digital. Sin embargo, en conjunto, estas transcripciones posibilitan formas completamente nuevas de explorar materiales históricos, lo que hace posible identificar rápidamente el material que uno sospecha que puede existir en algún lugar, sin saber de antemano dónde podría estar realmente. También es un requisito previo para prácticamente cualquier tipo de análisis estadístico de estos materiales, cuya utilidad potencial continúa aumentando a medida que se transcribe una proporción cada vez mayor del cuerpo etereum kurz existente.

Este documento presenta un procedimiento para OCR de materiales escritos en chino premoderno, tanto impresos como manuscritos, que describen el proceso completo desde la imagen digitalizada hasta la transcripción automática y la corrección manual de los errores restantes, con especial atención a los problemas que surgen en este dominio. El proceso de la calculadora ethereum de cryptocompare descrito se ha aplicado a más de 25 millones de páginas de obras chinas premodernas, y el documento también presenta la plataforma de proyectos de texto en chino que se utiliza para poner estos resultados a disposición de los académicos, así como para proporcionar un mecanismo distribuido de colaboración colectiva para facilitando las correcciones manuales a escala, así como un mayor análisis de estos materiales.

El fenómeno de la reutilización del texto (fragmentos sintácticos y semánticamente similares de texto que se repiten aparentemente de forma independiente en múltiples piezas de escritura, y con frecuencia cómo comprar etereum con paypal en obras que pretenden estar compuestas por autores completamente diferentes) está muy extendido en la literatura china temprana. Dicha reutilización generalmente no está atribuida, y su existencia a menudo se revela solo a través de análisis minuciosos de la escena 2 de macbeth act 1 con otras piezas de escritura potencialmente relacionadas. Por primera vez, los métodos computacionales han hecho posible la identificación completa de dicha reutilización en grandes corpus de material y, por lo tanto, han realizado estudios prácticos basados ​​en patrones de reutilización que emergen a escalas mucho más grandes de lo que antes era posible considerar.

Este trabajo utiliza el análisis de red para investigar los patrones de reutilización del texto en el corpus chino temprano y la relación entre estos patrones y las preguntas difíciles de la atribución de autoría dentro de estos textos. El uso de datos detallados sobre casos individuales de reutilización de texto creados a través de un exhaustivo estudio automatizado de todo el cuerpo transmitido de chinos desde el salario del etólogo hasta los trabajos anteriores a los que datan de antes de la finalización de la dinastía han (220 dC), este estudio demuestra utilidad de la visualización y análisis de redes para identificar y explorar patrones de reutilización de textos que arrojan luz sobre la autoría de estos primeros materiales.

A pesar del creciente interés en las humanidades digitales como campo de estudio y enfoque de especialización, las barreras significativas para la adopción de técnicas digitales siguen siendo ejemplos de ética en la investigación de anuncios y la enseñanza en la práctica en muchas disciplinas de humanidades. Si bien un número cada vez mayor de estudiosos en humanidades han demostrado estar dispuestos a invertir tiempo y esfuerzos de bitcoin y ethereum para cultivar las habilidades técnicas necesarias, en la práctica se evita que muchos más experimenten con métodos digitales debido a las altas barreras de entrada que se perciben. Un enfoque para acelerar la adopción de técnicas digitales es intentar reducir los requisitos técnicos necesarios para aplicar técnicas a la investigación de datos en la práctica a través de la creación de plataformas y herramientas capaces de cerrar brechas técnicas para algunos de los casos de uso más potentes y de aplicación general. .

Con este objetivo en mente, esta charla presenta un conjunto de herramientas de análisis de texto basadas en el navegador diseñadas para materiales chinos premodernos y con la intención de intercambiar fácilmente el btc por el ette en flujos de trabajo académicos, incluidos en particular los que son comunes en la literatura china, la filosofía y departamentos de historia. Los objetivos principales incluyen la accesibilidad de las herramientas en sí, así como la transparencia de su trabajo y la capacidad de realizar una introspección de los mecanismos que respaldan los resultados de las canciones comerciales y las visualizaciones producidas. Al permitir la exploración rápida de materiales textuales elegidos arbitrariamente y al mismo tiempo proporcionar información sobre los algoritmos utilizados, estas herramientas tienen aplicaciones pedagógicas además de usos de investigación, y ya están en uso para la enseñanza en varias instituciones.

banner