Buscador | Buscador

Resultados totales (Incluyendo duplicados): 2
Encontrada(s) 1 página(s)

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/AQ1CVX

Dataset. 2018

WORD SIMILARITY BENCHMARKS OF RECENT WORD EMBEDDING MODELS AND ONTOLOGY-BASED SEMANTIC SIMILARITY MEASURES

Lastra-Díaz, Juan J.
Goikoetxea, Josu
Hadj Taieb, Mohamed Ali
Garcia-Serrano, Ana
Ben Aouicha, Mohamed
Agirre, Eneko

This dataset is a companion reproducibility package of the related paper submitted for publication, whose aim is to allow the exact replication of a very large experimental survey on word similarity between the families of ontology-based semantic similarity measures and word embedding models as detailed in ‘appendix-reproducible-experiments.pdf’ file. Our experiments are based on the evaluation of all methods with the HESML V1R4 semantic measures library and the recording of these experiments with Reprozip. HESML is a self-contained Java software library of semantic measures based on WordNet whose latest version, called HESML V1R4, also supports the evaluation of pre-trained word embedding files. HESML is a self-contained experimentation platform on word similarity which is especially well suited to run large experimental surveys by supporting the execution of automatic reproducible experiment files on word similarity based on a XML-based file format called (*.exp). On the other hand, ReproZip is a virtualisation tool whose aim is to warrant the exact replication of experimental results onto a different system from that originally used in their creation. Reprozip captures all the program dependencies and is able to reproduce the packaged experiments on any host platform, regardless of the hardware and software configuration used in their creation. Thus, ReproZip warrants the reproduction of the experiments introduced herein in the long-term. Finally, other very valuable feature of Reprozip is that it allows to modify the input files of any Reprozip package with the aim of evaluating a set of experiments using originally unconsidered methods, configuration parameters or datasets. This dataset contains a Reprozip package to reproduce our experiments in any supported platform, as well as all pre-trained word embedding models and word similarity datasets used in our experiments. In addition, this dataset also contains all raw output files generated by our experiments, and a R script file to generate all output processed files corresponding to the data tables in our related paper. Finally, we provide a very detailed experimental setup in the aforementioned PDF file to allow all our experiments to be reproduced exactly.

Proyecto: //

DOI: https://doi.org/10.21950/AQ1CVX

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/AQ1CVX

HANDLE: https://doi.org/10.21950/AQ1CVX

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/AQ1CVX

PMID: https://doi.org/10.21950/AQ1CVX

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/AQ1CVX

Ver en: https://doi.org/10.21950/AQ1CVX

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/AQ1CVX

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/NZPEKR

Dataset. 2018

ESTUDIO SOBRE USO Y ACTITUD DE LA POBLACIÓN INTERNAUTA ANTE LOS SERVICIOS QUE OFRECEN LOS PORTALES WEB DE EMISORAS DE RADIO

Manuel Gertrudix Barrio
Felipe Gértrudix Barrio
Francisco García García
María del Carmen Gertrudis Casado

La investigación analiza cuál es el uso y la actitud de la población internauta ante los servicios que ofrecen los portales web de emisoras de radio. La encuesta evalúa el conocimiento declarado de los usuarios sobre los nuevos servicios de radio en Red, en qué medida se está modificando el perfil de estos, qué valoración hacen de dichos servicios, cuáles son los usos, hasta qué punto resultan satisfactorios y cubren las expectativas y demandas sociales, etc. Estudio sociológico. Método de recogida de información: Sistema de video cuestionario CATI (Computer Aided Telephone Interview) con control de rellamadas automático y ruta de cuestionario y monotorización en tiempo real. Universo: Población general de 16 años en adelante. Tamaño de la muestra: 524 entrevistas con un error máximo posible de +4.37% para una distribución de p/q=50 y un nivel de confianza del 95.5% (dos sigma) Selección: Polietápica aleatoria con cuotas de sexo y edad. Entrevista: Cuestionario estructurado que cuenta con 9 ítems y preguntas sociodemográficas: Edad, sexo, Provincia, Nivel de Estudios, Ocupación, Tamaño de hábitat, Nivel de ingresos del hogar, Número de hijos menores de 14 años. Cobertura geográfica: Ámbito: Nacional España (incluido Canarias, Ceuta y Melilla). Cobertura temporal: Fecha de campo: Del 4 al 10 de junio de 2007.

Proyecto: //

DOI: https://doi.org/10.21950/NZPEKR

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/NZPEKR

HANDLE: https://doi.org/10.21950/NZPEKR

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/NZPEKR

PMID: https://doi.org/10.21950/NZPEKR

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño

doi:10.21950/NZPEKR

Ver en: https://doi.org/10.21950/NZPEKR

e-cienciaDatos, Repositorio de Datos del Consorcio Madroño