Encontrada(s) 3387 página(s)
A REVISED DATASET OF REAL WAGES IN LATIN AMERICA, 1920-2011
- Astorga, Pablo
SOFTGP: GAUSSIAN PROCESS REGRESSION FOR FORWARD AND INVERSE KINEMATICS OF SOFT ROBOTS
- Relaño, Carlos
- Muñoz, Javier
- Monje, Concepción A.
FEDERICO-TENA WORLD TRADE HISTORICAL DATABASE : BARBADOS
- Federico, Giovanni
- Tena Junguito, Antonio
FIREURISK_EUROPE_FUEL_MAP: EUROPEAN FUEL MAP AT 1 KM RESOLUTION
- Aragoneses, Elena
- Garcia, Mariano
- Chuvieco, Emilio
FEDERICO-TENA WORLD POPULATION HISTORICAL DATABASE : ETHIOPIA
- Federico, Giovanni
- Tena Junguito, Antonio
GRUPO I DE 3 INFORMANTES. (OLIVENZA). LA VIDA DE LOS JÓVENES
- Álvarez Pérez, Xosé Afonso (coord.)
CORPUS DE 100 TEXTOS CORRESPONDIENTES A 5 GÉNEROS TEXTUALES DEL ÁMBITO DE LA ADMINISTRACIÓN
- Sara Pistola Grille
- Iria Da Cunha Fanego
- Susana Viñuales Ferreiro
El contenido de este dataset es resultado de la investigación llevada a cabo en el proyecto "Tecnologías de la Información y la Comunicación para la e-Administración: hacia la mejora de la comunicación entre Administración y ciudadanía a través del lenguaje claro" (TIC-eADMIN), cuyo principal objetivo era desarrollar, en el contexto de la e-Administración, una herramienta TIC en línea de ayuda a la redacción de textos administrativos en español por parte de empleados públicos, para contribuir a que los textos que reciba la ciudadanía estén redactados en lenguaje claro. Esta herramienta ya se ha desarrollado y puede utilizarse gratuitamente en línea desde el siguiente enlace: www.sistema-artext.com. Asimismo, uno de los objetivos específicos del proyecto era sistematizar los rasgos lingüísticos prototípicos de algunos géneros textuales del ámbito de la Administración, para lo cual se anotó un corpus y se analizaron los resultados.
, Descripción del datasetEste dataset contiene 2 ficheros. El primero de ellos incluye un corpus de 100 textos reales (121.548 palabras) del ámbito de la Administración en formato .txt. Los textos se corresponden con 5 géneros textuales prototípicos de este ámbito: acta de inspección, contrato, requerimiento, resolución dirigida a un particular y resolución publicada en portales institucionales (20 textos por género). El segundo fichero contiene el mismo corpus de 100 textos anotado utilizando la herramienta ATLAS.ti, tanto en el formato propio de la herramienta (.atlproj23) como en XML. Para la anotación se tienen en cuenta los siguientes rasgos lingüísticos: apartados, títulos, contenidos y fraseología representativa para expresar esos contenidos. Los resultados de la anotación de este corpus y su posterior análisis se han integrado en el sistema arText para ayudar al personal público a estructurar y redactar estos géneros textuales dirigidos a la ciudadanía.
, MetodologíaLa metodología empleada para la obtención de los datos incluye 5 etapas:
- Etapa 1. Selección de los 5 géneros textuales objeto del estudio. Los criterios de selección de los géneros son: frecuencia y dificultad de escritura de los géneros por parte del alumnado universitario de derecho y del personal público, y cantidad de texto libre presente en modelos o plantillas. Para obtener esta información se llevaron a cabo dos encuestas: una al alumnado de la UNED y otra al personal del Ayuntamiento de Madrid.
- Etapa 2. Compilación del corpus. El corpus está formado por 100 textos (20 por cada género textual) generados por el Ayuntamiento de Madrid, institución que se ha tomado como caso de estudio. Esta cantidad es estadísticamente representativa para el análisis de textos de ámbitos especializados, según se indica en investigaciones previas.
- Etapa 3. Transformación del corpus a texto plano y anonimización. Los textos del corpus se encuentran en distintos formatos, por lo que se transforman a texto plano. Asimismo, los textos de carácter privado (correspondientes a los géneros acta de inspección, requerimiento y resolución dirigida a un particular) se anonimizan.
- Etapa 4. Selección de los rasgos lingüísticos que se tienen en cuenta para el análisis del corpus. Los rasgos que se analizan son: a nivel textual, los apartados, los títulos y los contenidos, y a nivel léxico, la fraseología.
- Etapa 5. Anotación del corpus mediante la herramienta ATLAS.ti.La anotación se lleva a cabo manualmente. Los rasgos lingüísticos se anotan en ATLAS.ti mediante códigos de distintos colores: los apartados en rojo, los títulos en verde, los contenidos en azul y la fraseología en amarillo.
MIGUEL CARRASCO, AS ELLAS / ELJAS (ALMAZARA AS PONTIS). ACEITE
- Álvarez Pérez, Xosé Afonso (coord.)
VARIOS INFORMANTES (HERRERA DE ALCÁNTARA). CONVERSACIÓN
- Álvarez Pérez, Xosé Afonso (coord.)
FEDERICO-TENA WORLD TRADE HISTORICAL DATABASE : FRENCH SOMALIA
- Federico, Giovanni
- Tena Junguito, Antonio