Entradas

Mostrando entradas de enero, 2018

7.- R: Packages : SixSigma, Qcc

Imagen
 Ya hemos comentado la gran cantidad de paquetes ( packages en lenguaje R) disponibles para acelerar la toma de decisiones y poder concentrarnos en la valoración de resultados ( el listado completo de paquetes está en el CRAN/Packages ). No hay que perder de vista que tratamos con software open-source, y si bien los paquetes están seguramente muy depurados, los autores son conocidos y accesibles via e-mail, hay foros, ... nos toca a nosotros tomar la ultima decisión con la información que obtenemos.  En relación con el tema de la calidad y el control estadístico de proceso, hay entre otros dos paquetes disponibles que veremos a continuación : SixSigma :  Enlace a la información en CRAN Qcc :  Enlace a la información en CRAN  Si los paquetes no están disponibles en la instalación que tengamos de R en nuestro ordenador, lo primero será instalarlos mediante install.packages(...) , como vemos a continuación : u...

6.- R : Gráficos y pastel

Imagen
Vamos a ver dos tipos adicionales de gráficos disponibles en R, el gráfico de caja (boxplot) y el gráfico de sectores. Con esto terminaré la presentación gráfica de datos en el módulo básico de R. El gráfico de caja presenta la distribución de valores de una variable, vemos un ejemplo :  la interpretación de este gráfico es como sigue :  Maximo/Mínimo : El valor máximo/mínimo de la distribución de datos. Quartil 25% y 75% : Valor que nos reparte el 25% y el 75% de la distribución. Mediana : El valor que nos reparte el 50% de la distribución. En este ejemplo a continuación hemos tomado un conjunto de datos disponible en R que tiene dos atributos, la altura y el peso medio de la mujer americana y nuestro resultado es como sigue :  Este es un buen ejemplo para mostrar que debemos prestar atención con la presentación de los datos, estamos poniendo en la misma escala el peso y la altura de la mujer ... hay que prestar atención a las ...

5.2.- R: cambio de tema de RStudio, paste(...), format(...), rug(...)

Imagen
Como en la entrada anterior vemos con más detalle las novedades que hemos necesitado para esta entrada.  - Cambio de tema de RStudio : Si RStudio es el IDE que usamos, podemos cambiar su aspecto (tema) de la siguiente manera (RStudio, preferencias, Apariencia) y obtenemos la siguiente pantalla donde elegir el aspecto de nuestro IDE : - paste (...)  paste(...) convierte a cadena los parámetros que se le pasan y los concatena utilizando el separador que se le pasa como parámetro. La mayor utilidad de paste(...) puede ser en salida a fichero RMarkdown donde nos puede venir bien "ocultar" el código y dejar sólo la salida o bien hacer más clara la salida por consola. Vemos a continuación un par de ejemplos : - format (...) Siguiendo con el tema del formato, en determinados casos nos puede interesar presentar los números con determinado formato, para por ejemplo presentar un determinado número  de dígitos signif...

5.3.- Código R de la entrada

Incluyo aquí el código R de esta entrada para poder practicar con él : #    Cargo el paquete para el calculo de la moda # library(modeest) #    Cargamos los datos del nivel del lago Huron entre 1875-1972 # data ("LakeHuron") #    Las medidas de centralización de los datos # paste (' La media es   : ', format(mean(LakeHuron), digits=5)) paste (' La mediana es : ', format(median(LakeHuron), digits=5)) paste (' La moda es    : ', format(mfv(LakeHuron), digits=5)) #    La medida de dispersión de los datos # paste(' La desviación standard es : ',format(sd(LakeHuron), digits = 4) ) paste(' La varianza es : ', format(sd(LakeHuron)^2, digits = 4) ) #    Salidas gráficas # hist(LakeHuron, main='Nivel de Lago Huron', xlab = 'Nivel',      ylab = 'DENSIDAD',      xlim = c(574, 585),      prob=TRUE) #    presentamos la densidad de los datos para comprobar la ...

5.1.- R: Control de proceso, valoración estadística de una variable ....

Imagen
 Una de las aplicaciones prácticas de la estadística univariante es el control de estadístico de proceso, vamos a ver cómo se puede realizar en R. Para facilitar el seguimiento del código no usaré variables, en un entorno profesional o de programación lo estándar seria almacenar valores en variables y después usarlos (el operador de asignación en R es:  '<-'), de esa forma evitamos que R tenga que cálcular continuamente valores.  Resumiendo mucho, sabemos que un proceso está bajo control estadístico cuando sigue una distribución normal, centrada en las tolerancias, su indice de capacidad Cpk>1,33 ... hay abundante literatura disponible al respecto.   Por motivos de disponibilidad de datos, para esta entrada del blog usaremos los datos disponibles en R/RStudio. Cómo hemos indicado anteriormente muchos de los paquetes de R vienen con conjuntos de datos disponibles para poder utilizar. En la captura de pan...

5.- R : Estadistica univariante

Imagen
Antes de abordar un tema como el control de proceso, estadístico o no, con R quiero revisar antes algunos conceptos en entorno R de estadística univariante que se necesitan posteriormente. Empecemos : - Población : Conjunto de individuos que son objeto de estudio.  Ejemplo :  Las piezas producidas en un turno, serán la población de ese turno. La cantidad de medidas que registramos en un periodo, serán la población en estudio. .... - Muestra : Cualquier subconjunto tomado de la población. Ejemplo : En entornos que no se controle 100% de la producción, las piezas que se controlan son una muestra. El numero de medidas de temperatura que se registre en una estación meteorológica será una muestra de la evolución de la temperatura  ... Conociendo una población es posible hacer previsiones fiables de cómo será la muestra, conociendo la muestra es muy arriesgado hacer previsiones de cómo será la población. Un ejemplo...

4.2.- R : c(..), lm(..), abline (..), plot(...), hist(...)

Imagen
Ya hemos comentado la posibilidad del sistema de ayuda de R o RStudio, para conocer en detalle sus funciones, no obstante en esta entrada del blog veremos de forma breve algunas de las funciones vistas hasta ahora :  - c(...) c(...) devuelve la combinación de sus argumentos, en forma de vector y sobre ese vector resultante se pueden realizar operaciones o aplicar instrucciones de generación de gráficos. Un ejemplo de uso de c(...) es generar una variable con el resultado de la medida, pesada, ... de alguna de las variables de nuestro proceso. A continuación vemos algunos ejemplos de su uso (salida en consola), y la llamada a la ayuda (abajo a la derecha) y vemos que en el entorno global se han generado dos variables datos1 y datos2 Podemos ver en la salida de consola que tanto en el caso de la multiplicación como de la división, cada uno de los elementos se le ha aplicado la operación. - lm(...) lm(...) es la función que permite general una interpol...

4.1.- R Básico : Documentación

Imagen
  Anteriormente en la entrada 4 de este blog, hemos visto como RStudio desde el desplegable de "Export" (de la pestaña Plots), nos permite gestionar lo que deseamos hacer con los gráficos resultado de nuestro análisis :  Una vez obtengamos la salida la podemos tratar según nuestro interés, anexo, pegar en documento ....  RStudio permite generar entre otras una salida a fichero HTML, el cual podemos usar para nuestra comunicación de resultados. En el menú de ayuda de RStudio hay un acceso a la ayuda rápida de Markdown, o la  Cheatsheet que conviene echarle un vistazo.  Para generar una salida Markdown, hemos de seleccionar la opción correspondiente en el menú de Fichero, como vemos a continuación : y obtendremos en la zona de edición una plantilla para empezar a introducir nuestro código. No he encontrado forma sencilla de hacer un script en R y después sin cortar y pegar poder pasarlo a Markdown, por ello mi...

4.- R Básico

Imagen
 Vamos a ver a continuación en R-Studio una serie de operaciones sencillas en R, actuando sobre variables.  E n primer lugar hemos de tener en cuenta que el operador asignación de valor en R es "<-"  ( en RStudio la combinación de teclas Alt+-), asignamos la variable/s y después  realizamos la operación ... siempre es una buena política documentar adecuadamente lo que hacemos para ello el operador para los comentarios es "#".  En el ejemplo se ha realizado sobre la zona "script" de RStudio, pero se podía haber realizado sobre la zona consola (abajo a la izquierda), en caso de necesitar ayuda abajo a la derecha RStudio nos proporciona acceso a la ayuda (pestaña "Help").  Entre otras muchas cosas, la idea del uso de R es el tratamiento de datos numéricos y comprobar la información que estos datos nos proporcionan, esta valoración preliminar se denomina análisis exploratorio de datos (en inglés EDA). De la Wikipedia obtenemos : ...