domingo, 27 de abril de 2014


Software para el Análisis de Datos Cuantitativos Estadísticos. SPSS.




Si se habla del campo de aplicación y variedad de software para el análisis de datos cuantitativo las posibilidades son variadas, la construcción de esta clase de software parece estar mucho más al alcance de la comunidad científica, se puede encontrar desde que cualquier construya  una planilla de Excel para hacer algunos análisis sencillos, hasta  los programadores que implementan toda esta clase de operaciones en paquetes de haciendo análisis de datos cuantitativos más profundos y complejos.



Entre los software para el análisis de datos cuantitativos, se pueden mencionar los siguientes:

  • Microsoft Excel
  • Calc (una hoja de cálculo Open Source y software libre compatible con Microsoft Excel)
  • SAS
  • SPSS
  • Minitab
  • Matlab
  • Past
  • OpenStat
  • Genstat
  • Stata

El funcionamiento de cada software es similar, incluye dos partes: una para definir las variables, que a su vez explican los datos y la otra, para la matriz de dato.

En líneas generales, utilizar un software para el análisis de datos cuantitativos, permite ahorrar tiempo y esfuerzo, facilitar y agilizar cálculos que para realizar de manera manual se necesitan horas de trabajo; además ofrece mayor exactitud en los resultados, evitando datos erróneos al momento de vincular distintos resultados que se fueron redondeando para facilitar un cálculo; permite manejar grandes cantidades de datos a la vez.

SPSS es un programa estadístico informático muy usado en las ciencias sociales y las empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo de Statistical Package for the Social Sciences aunque también se ha referido como "Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS).

Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research Center estuvo a cargo del desarrollo, distribución y venta del programa. A partir de 1975 corresponde a SPSS Inc. Inicialmente el programa fue creado para grandes computadores. En 1970 se publica el primer manual de usuario del SPSS por Nie y Hall. Este manual populariza el programa entre las instituciones de educación superior en EE. UU. En 1984 sale la primera versión para computadores personales.

SPSS es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad para trabajar con grandes bases de datos y un sencillo interface para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar análisis con 2 millones de registros y 250.000 variables. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos.



Desde la versión 14, pero más específicamente desde la versión 15 se ha implantado la posibilidad de hacer uso de las librerías de objetos del SPSS desde diversos lenguajes de programación. Aunque principalmente se ha implementado para Python, también existe la posibilidad de trabajar desde Visual Basic, C++ y otros lenguajes de programación.


Aplicación en tema de Investigación:

Para el tema de investigación titulado: "Perspectivas de Desarrollo del Sector Metalmecánico del Estado Táchira", se ha seleccionado usar el software SPSS, para realizar el análisis de resultados del instrumento aplicado, aunque su uso en este caso será de las funciones básicas establecidas por el software, sin necesidad de realizar ningún modelo de programación para análisis de resultados.

La gran utilidad de este software es una gran ventaja para la investigación, además de su amplia variedad de análisis predeterminados que se pueden obtener y graficas, facilidad para exportar datos en paquetes de Microsoft office, y su facilidad para manejar grandes cantidades de muestras y variables.

Una de las grandes ventajas para el uso y manejo de este software en este tema de investigación, es la disponibilidad del mismo en mi área de trabajo, así como también la facilidad y acceso a horas de capacitación para inducción y manejo del software recibido por el grupo de trabajo de la universidad donde trabajo. Este software permite efectuar tanto análisis estadísticos básicos como avanzados. En la mayor parte de las ocasiones, las organizaciones necesitan reportes descriptivos del proyecto. En otros casos, se comparan las características de dos o más grupos con respecto a diversas variables

El SPSS permite un tratamiento integrado de todas las fases que conlleva el análisis de datos. Estas son:

1. Planificación.

2. Elaboración y/o acceso a la base de datos.

3. Preparación de los datos.
Limpieza y selección de los datos, realizar transformaciones necesarias y análisis de valores perdidos.

4. Análisis de los datos.
Esta es la base y mayor utilidad del SPSS. Dicho programa cubre un amplio rango de procedimientos estadísticos que permiten resumir y describir los datos (por ejemplo, tablas de frecuencias, tablas de contingencia, estadísticos descriptivos), determinar si existen diferencias significativas entre grupos (prueba T para una muestra, para muestra independientes y dependientes, ANOVA de un factor), ajustar a nuestros datos el modelo lineal general (univariante, multivariante, de medidas repetidas, componentes de la varianza), análisis de datos categóricos (modelos loglineales), análisis psicométricos (análisis de la fiabilidad), pruebas no paramétricas (chi-cuadrado, Kolmogorov-Smirnov), realizar gráficos (por ejemplo gráficos de barras, diagramas de dispersión), entre otras muchas cosas.  

5. Elaboración de un informe


Módulos Principales del SPSS:

El sistema de módulos de SPSS, como los de otros programas (similar al de algunos lenguajes de programación) provee toda una serie de capacidades adicionales a las existentes en el sistema base. Algunos de los módulos disponibles son:

Modelos de Regresión

Modelos Avanzados
  • Reducción de datos: Permite crear variables sintéticas a partir de variables colineales por medio del Análisis Factorial.
  • Clasificación: Permite realizar agrupaciones de observaciones o de variables (cluster analysis) mediante tres algoritmos distintos.
  • Pruebas no paramétricas: Permite realizar distintas pruebas estadísticas especializadas en distribuciones no normales.
Tablas: Permite al usuario dar un formato especial a las salidas de los datos para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los desarrolladores del software por dejar de lado el sistema original de TABLES para hacer uso más extensivo de las llamadas CUSTOM TABLES.

Tendencias

Categorías: Permite realizar análisis multivariados de variables normalmente categorías. También se pueden usar variables métricas siempre que se realice el proceso de recodificación adecuado de las mismas.

Análisis Conjunto: Permite realizar el análisis de datos recogidos para este tipo específico de pruebas estadísticas.

Mapas: Permite la representación geográfica de la información contenida en un fichero (descontinuado para SPSS 16).

Pruebas Exactas: permite realizar pruebas estadísticas en muestras pequeñas.

Análisis de Valores Perdidos: Regresión simple basada en imputaciones sobre los valores ausentes.

Muestras Complejas: permite trabajar para la creación de muestras estratificadas, por conglomerados u otros tipos de muestras.

SamplePower (cálculo de tamaños muestrales)

Árboles de Clasificación: Permite formular árboles de clasificación y/o decisión con lo cual se puede identificar la conformación de grupos y predecir la conducta de sus miembros.

Validación de Datos: Permite al usuario realizar revisiones lógicas de la información contenida en un fichero ".sav" y obtener reportes de los valores considerados atípicos. Es similar al uso de sintaxis o scripts para realizar revisiones de los ficheros. De la misma forma que estos mecanismos es posterior a la digitalización de los datos.


Sistema de Ficheros SPSS: 

Archivos de Datos: son unos de los principales  (extensión. SAV).

Archivos de salida (output, extensión. SPO): en estos se despliega toda la información de manipulación de los datos que realizan los usuarios mediante las ventanas de comandos. Son susceptibles de ser exportados con varios formatos (originalmente HTML, RTF o TXT, actualmente la versión 15 incorpora la exportación a PDF junto a los formatos XLS y DOC.



Archivos de sintaxis (extensión. SPS): la mayoría de las ventanas de SPSS cuentan con un botón que permite hacer el pegado del proceso que el usuario desea realizar. Lo anterior genera un archivo de sintaxis donde se van guardando todas las instrucciones que llevan a cabo los comandos del SPSS. Este archivo es susceptible de ser modificado por el usuario

Fichero de scripts (extensión. SBS): es utilizado por los usuarios más avanzados del software para generar rutinas que permiten automatizar procesos muy largos y/o complejos. Muchos de estos procesos suelen no ser parte de las salidas estándar de los comandos del SPSS, aunque parten de estas salidas.


Ventajas del software:

  • Permite un ahorro de tiempo y esfuerzo realizando en segundos un trabajo que requeriría horas e incluso días.
  • Hace posible cálculos más exactos, evitando los redondeos y aproximaciones del cálculo manual.
  • Permite trabajar con grandes cantidades de datos, utilizando muestras muy grandes e incluyendo mas variables.
  • Permite trasladar la atención desde las tareas mecánicas de cálculo a las tareas conceptuales: decisiones sobre el proceso, interpretación de resultados, análisis critico.

Desventajas del Software:

  • Si el usuario no tiene experiencia previa utilizando SPSS o si sus conocimientos de estadística no están actualizados, es difícil discernir que opciones seleccionar.
  • La mayoría de los reportes de resultados contiene un nivel excesivo de información que más que aclarar puede llegar a confundir al usuario.
  • Hay quienes no utilizan SPSS, ya que no es muy accesible desde un punto de vista económico, no posee una buena política hacia otros proveedores de paquetes estadísticos, si el usuario no tiene experiencia previa en la utilización de SPSS o sus conocimientos de estadística no están actualizados es difícil discernir qué opciones seleccionar, posee una gran cantidad de información en forma automática que puede distraer al usuario.


Bibliografía Consultada:





7 comentarios:

  1. Hola Zaida, me es grato saludarte

    El Software que consideras utilizar en el desarrollo de tu proyecto de investigación de acuerdo a lo abortado en el blog y a revisiones teóricas realizadas, es uno de los programas a nivel estadístico que cuenta con la mayor capacidad de manejar gran cantidad de registros y variables. Una de las bondades que a los usuarios les beneficia utilizar el SPSS, cuando se requieren manejar altos volúmenes de datos.

    Por otra parte, también se debe tener en cuenta que para emplear este tipo de software se requiere contar con conocimientos estadísticos y dependiendo de lo complejo que se vaya a desarrollar, conocer de lenguajes de programación. Sin embargo, lo valioso para el desarrollo de tu investigación y como mencionas en el blog, es que a nivel de tu trabajo cuentas con el acceso al programa a través de la Universidad y con el apoyo de horas de capacitación para el manejo del mismo.

    Puntos de gran importancia para elegir trabajar con el paquete SPSS (que no es una licencia gratuita) y que te va generar grandes aportes en los cálculos de tu investigación.

    Éxito en el desarrollo de tu proyecto,

    Saludos,

    Karlas

    ResponderEliminar
    Respuestas
    1. Gracias por tu aporte Karlas, y efectivamente, la mayor ventaja de usar este prestigioso software es el fácil acceso al mismo, y a la capacitación necesaria. Sabiendo que tendré resultados confiables de la aplicación del análisis de datos.
      Saludos!.

      Eliminar
  2. Saludos Zaida,
    Muy bueno el aporte que realizas en este blog, desconocía completamente este programa estadístico y me parece oportuno poder contar con diferentes opciones para tomar el más apropiado para la investigación que podré desarrollar a futuro

    Saludos!

    ResponderEliminar
    Respuestas
    1. Gracias Romina,

      De verdad es un software muy completo, y tiene muchas ventajas en su uso y aplicación, es uno de los más usados y populares en el campo de las ciencias sociales, así que si tu estudio está por esta área, sería buena opción. La gran desventaja, el costo y el manejo.

      Saludos,

      Zaida.

      Eliminar
  3. Hola Zaida, comparto tu opinión sobre el software SPSS y te felicito por la información aportada en tu blog, pues ciertamente el utilizar un software para el análisis de datos cuantitativos como el SPSS nos permite ahorrar tiempo y esfuerzo, facilita y agiliza los cálculos.
    Así mismo nos ayuda a saber que tan confiable es el instrumento que estamos utilizando y al permitir al usuario dar un formato especial a las salidas de los datos en tablas para su uso posterior, esto nos ayuda (al igual que las distintas gráficas) a la hora de los análisis y conclusiones en nuestros trabajos de investigación permitiendo realizar un mejor análisis crítico. Éxitos :)

    ResponderEliminar
    Respuestas
    1. Muchas Gracias Alicia, por tan valioso aporte, aunque los reporte de datos de spss no son muy amigables, es cuestión de tomar la información necesaria para realizar el análisis mas oportuno!

      Saludos

      Zaida

      Eliminar
  4. Saludos Zaida, tambien aplicare el SPSS y tiene muchisimas bondades para analisis de datos cuantitativos, aun cuando planteas que lo utilizaras para algunas funciones basicas, este estadistico tambien te permitira analizar la validacion de expertos de tu instrumento de recoleccion de informacion e incluso puedes estimar la confiabilidad del instrumento. respecto a los datos de tu investigacion te permite realizar estadistica descriptiva o inferencial ademas de realizar correlaciones entre las variables de tu investigacion.
    De verdad que en la medida que avancemos en el desarrollo de la investigacion y que nos capacitemos con el uso el SPSS conoceremos su potencial uso para el analisis de datos de nuestros proyectos, en tu caso me parece excelente que tengas esta facilidad de formación. Aprovéchala
    Muchisimo exito

    ResponderEliminar

Puedes colocar tus comentarios aquí! Gracias