Archivo del blog

lunes, 27 de febrero de 2017

UF1466_1 : Organización y gestión de la información

Sistema de archivos
Un sistema de archivos es una estructura que permite tanto el almacenamiento de información en una partición como su modificación y recuperación. Para que sea posible trabajar en una partición es necesario asignarle previamente un sistema de archivos. 
Esta operación se denomina dar formato a una partición. 
Generalmente cada sistema de archivos ha sido diseñado para obtener el mejor rendimiento con un sistema operativo concreto 
    FAT para DOS, FAT32 para Windows 98, NTFS para Windows NT, HPFS para OS/2…
Sin embargo, es usual que el mismo sistema operativo sea capaz de reconocer múltiples sistemas de archivos. 

Resumiendo, que son?
Métodos para el almacenamiento y organización de archivos de computadora y los datos que estos contienen
Se usan en dispositivos de almacenamiento como discos duros y CD-ROM e involucran el mantenimiento de la localización física de los archivos.

Resumiendo, como funcionan?
El software del sistema de archivos se encarga de organizar los archivos (que suelen estar segmentados físicamente en sectores de 512 bytes) y directorios, manteniendo un registro de qué bloques pertenecen a qué archivos, qué bloques no se han utilizado y las direcciones físicas de cada bloque.

Soportes de almacenamiento
Los soportes de almacenamiento además de la estructura física tienen una estructura lógica que es la base para el almacenamiento de información:
  • Sector

    • Un sector es la unidad mínima de almacenamiento.
    • Esta unidad viene limitada por el soporte físico y no puede modificarse
    • Es imposible escribir o leer una unidad inferior a esta
    • Los tamaños de los sectores oscilan entre 512 bytes y 4 Kb según fabricantes
  • Bloque o clúster

    • Un bloque o clúster es un conjunto de sectores físicos
    • Es la unidad mínima de almacenamiento del sistema de ficheros, de manera que cada bloque puede estar compuesto por varios sectores físicos
    • El tamaño de un bloque puede oscilar entre 512 bytes y 128 Kb dependiendo del sistema de ficheros o la configuración del sistema
Fragmentación
Un fichero puede estar formado por uno o varios bloques que no tienen porque ser contiguos
Cuando un fichero está almacenado en bloques no contiguos tiene pérdida de rendimiento
Aquí surge el concepto de fragmentación

Fragmentación externa:
Se provoca por la falta de reorganización de bloques en el sistema de ficheros 
Las sucesivas operaciones de creación y eliminación de ficheros de distintos tamaños provoca huecos en los bloques utilizados por los ficheros

Fragmentación interna:
Es la pérdida de capacidad en el soporte de almacenamiento debido a que el tamaño del fichero no es múltiplo exacto del tamaño de los bloques
Si un fichero no ocupa por completo el bloque, el espacio sobrante no podrá ser usado por otro fichero y queda desperdiciado

Desfragmentación:
Es el proceso de ordenar los bloques de información disponible distribuida en el soporte de almacenamiento para tener una zona de bloques utilizados y una de disponibles
De este modo, el sistema volverá a ser eficiente en el acceso de los ficheros

Nomenclatura y codificación
Un fichero es un conjunto de información relacionada de forma lógica a la que se le da nombre para identificarla de forma unívoca
Cada sistema de ficheros almacena la información de manera diferente según la implementación del sistema de ficheros y los metadatos

Por lo general los sistemas operativos tienen su propio sistema de ficheros
  • MS-DOS (y Windows 3.1) reconoce únicamente particiones FAT
  • Windows 95 admite tanto particiones FAT como VFAT;
  • Windows 98 y Windows 95 OSR2 soportan FAT, VFAT y FAT32
  • Windows NT 4.0 admite particiones FAT, VFAT y NTFS
  • Windows 2000 admite particiones FAT, VFAT, FAT32 y NTFS
  • Linux admite su propio sistema de archivos EXT, EXT2, EXT3, … y, dependiendo de las versiones, la mayoría de los anteriores. 
  • Windows XP, Vista y Windows 7 admiten particiones FAT, FAT32 y NTFS 
FAT
Los sistemas de ficheros de la familia FAT (File Allocation Table) son sistemas de ficheros desarrollados inicialmente para el sistema operativo Microsoft
Posteriormente se han adaptado a las siguientes versiones de los sistemas operativos del a compañía
  • Principal ventaja: fácil implementación
  • Principal inconveniente: genera fragmentación externa en el soporte de almacenamiento
Los sistemas de ficheros FAT están compuestos por 4 regiones
  • Primer sector, información básica sobre la partición. Sector de arranque
  • Región de FAT, existen dos copias de la tabla de asignación de ficheros. En esta región se almacena información de los bloques ocupados
  • Directorio raíz, índice inicial donde están los directorios y ficheros que están en la ruta principal
  • Región de datos, se almacenan los datos de los ficheros y directorios
Los metadatos relativos al nombre que pueden recibir los ficheros de la familia FAT son:
  • SFN (Short FileName), se podían usar ocho caracteres por nombre y 3 por extensión
  • LFN (Long FileName), desde 1994, hasta 255 caracteres para el nombre del fichero
FAT12
Primera versión de FAT, creada como sistema de archivos para diskette.
No soporta anidación de carpeta.
Las direcciones de bloque solamente contienen 12 bits. Esto complica la implementación.
El tamaño del disco se almacena como una cuenta de 16 bits expresada en sectores, lo que limita el espacio manejable a 32 megabytes.

FAT16
El sistema de archivos FAT es un sistema de 16 bits. Esto implica que las direcciones de clúster no pueden ser mayores a 16 bits.
El número máximo de clústers al que se puede hacer referencia con el sistema FAT es, por consiguiente, 216 (65536) clústers.
El tamaño máximo de la partición FAT se puede determinar multiplicando el número de clústers por el tamaño de un clúster. Con clústers de 32Kb, el tamaño máximo de una partición es, por lo tanto, de 2GB.
Nombres de archivos de hasta 8 caracteres y tres extensiones de caracteres.

FAT32
Sistema que utiliza un direccionamiento de cluster de 32bits, lo que le permite superar el límite de 2Gb en las particiones, si bien se mantiene el tamaño máximo de archivo, que es de 4Gb. 
El tamaño del cluster utilizado sigue siendo de 32Kb, lo que sigue significando un importante desperdicio de disco, ya que un archivo de 1Kb está ocupando en realidad 32Kb de disco. 

NTFS
Sistema de archivos diseñado específicamente para Windows NT y utilizado por las versiones recientes del sistema operativo Windows.
Permite definir el tamaño del clúster de forma independiente al tamaño de la partición.
El tamaño mínimo del bloque es de 512 bytes.
Este sistema también admite compresión nativa de archivos y encriptación.
Puede manejar discos de hasta 2 terabytes.
Principales características:
  • NTFS siempre ha sido un sistema de archivos más eficaz que FAT y FAT32 ya que funciona mejor con discos de gran tamaño.
Todo lo que tiene que ver con los ficheros, se almacena en forma de metadatos. Esto permitió una fácil ampliación de características durante el desarrollo de Windows NT, como la inclusión de campos de indexado añadidos para posibilitar el funcionamiento de Active Directory.
Los nombres de archivo son almacenados en Unicode (UTF-16), y la estructura de ficheros en árboles-B, una estructura de datos compleja que acelera el acceso a los ficheros y reduce la fragmentación, que era lo más criticado del sistema FAT.

Se emplea un registro transaccional (journal) para garantizar la integridad del sistema de ficheros (pero no la de cada archivo). Los sistemas que emplean NTFS han demostrado tener una estabilidad mejorada, que resultaba un requisito ineludible considerando la naturaleza inestable de las versiones más antiguas de Windows NT.
Sin embargo, este sistema de archivos posee un funcionamiento prácticamente secreto, ya que Microsoft no ha liberado su código como hizo con FAT.

Ventajas
  • Mejor escalabilidad a unidades de gran tamaño. El tamaño máximo de partición o volumen para NTFS es mucho mayor que para el sistema FAT y, al aumentar el tamaño del volumen o la partición, el rendimiento con NTFS no disminuye como sucede con el sistema FAT.
  • Active Directory (y los dominios, que forman parte de Active Directory). Con Active Directory, se pueden ver y controlar los recursos de red de forma sencilla.
  • El Cifrado de Archivos, que mejora en gran medida la seguridad. (Sin embargo, no se puede comprimir y cifrar un archivo al mismo tiempo.)
  • Los Permisos que pueden establecerse en archivos individuales en vez de sólo en carpetas.
  • Las Cuotas de Disco, que pueden utilizarse para supervisar y controlar la cantidad de espacio en disco utilizada por usuarios individuales. 
  • El Almacenamiento Remoto, que proporciona una extensión al espacio en disco, lo que facilita el acceso a los medios extraíbles, como las cintas. 
  • El Registro de recuperación de la actividad del disco, que permite a NTFS restaurar información con rapidez en el caso de producirse un corte de alimentación u otro tipo de problemas en el sistema.
  • Archivos esparcidos: archivos de gran tamaño, creados por las aplicaciones de manera que únicamente es necesario un espacio limitado en disco. Es decir, NTFS solamente asigna espacio en disco a las partes del archivo en las que se escribe.
Desventajas:
  • Utiliza gran cantidad de espacio en disco para sí mismo.
  • No es compatible con sistemas operativos como DOS, Windows 95, 98 ni ME.
  • No puede ser usado en disquetes.
  • La conversión a NTFS es unidireccional, por lo tanto, no se puede volver a convertir en FAT al actualizar la unidad.
EXT
Implementado en 1992, fue el primer sistema de archivos creado específicamente para Linux.
Tiene estructura de metadata basada en USF (Unix File System)
El tamaño máximo de la partición es de 2GB
Soporta nombres de hasta 255 caracteres de largo.

EXT2
Tamaño de bloque de archivos de 1kb a 4kb
El sistema de archivos particiona los bloques de disco en grupos. Cada grupo incluye bloques de datos e inodos almacenados en pistas adyacentes reduciendo el tiempo de acceso a los mismos.
Soporte para comprobaciones automáticas de consistencia sobre el estado del sistema de archivos en el arranque del sistema.
Estrategia de actualización de archivos que minimiza el impacto de las caídas del sistema.

EXT3
Sistema de archivos muy similar a EXT3, sólo que implementa el registro por diario (journaling).
Menor consumo de CPU
Es considerado más seguro que otros sistemas de ficheros en Linux, dada su relativa sencillez y su mayor tiempo de prueba.

EXT4
Soporte de volúmenes de hasta es capaz de trabajar con volúmenes de hasta 1 exbibyte (Equivale a 2^60 bytes) y ficheros de tamaño de hasta 16 TB.
Soporte añadido de extent (conjunto de bloques físicos contiguos, que mejoran el rendimiento al trabajar con ficheros de gran tamaño y reducen la fragmentación)
Menor uso del CPU.
Mejoras en la velocidad de lectura y escritura
Compatibilidad hacia adelante y hacia atrás

HPFS
HPFS es el sistema de archivos propio de OS/2. Utiliza una estructura muy eficiente para organizar los datos en las particiones. 
HPFS no utiliza grupos sino directamente sectores del disco (que equivalen a un grupo de 512 bytes). En vez de utilizar una tabla FAT al principio de la partición, emplea unas bandas distribuidas eficazmente por toda la partición. De esta forma se consigue, suprimir el elevado número de movimientos que los cabezales de lectura/escritura tienen que realizar a la tabla de asignación en una partición FAT. El resultado de este sistema es una mayor velocidad de acceso y un menor desaprovechamiento del espacio en disco. 

Explicacion inicial sistemas FAT, FAT32, NTFS
https://www.youtube.com/watch?v=p2309jhCi9I

Diferencias FAT, NTFS, ExFAT
https://www.youtube.com/watch?v=MHXlzIj1SnE

Pasar archivos de más de 4Gb a pen drive, formatear PenDrive en NTFS
https://www.youtube.com/watch?v=HH1RbW4C5i8

Jerarquías de almacenamiento
Las jerarquías de almacenamiento son las normas que definen los directorios principales y sus contenidos en cada uno de los sistemas operativos
La más extendida es la usada por Unix, HFS (FileSystem Hierarchy Standard)

Los directorios pueden clasificarse en:
  • Estáticos
    • Son los ficheros que pueden ser leídos por cualquier usuario pero  solo modificado por el administrador del sistema
  • Dinámicos
    • Son los ficheros que pueden ser leídos y modificados por el usuario administrador y por los usuarios con permisos para dichas tareas 
Supuesto práctico: Instalación de MINIX y comprobación de su estructura jerárquica de directorios

MINIX es un clon del sistema operativo Unix distribuido junto con su código fuente y desarrollado por el profesor Andrew S. Tanenbaum en 1987.
Esta diseñado principalmente para tener una fiabilidad muy alta, y ser estable en PCs de pocos recursos, y aplicaciones de pocas funciones.
Fue hecho principalmente para fines educativos, por eso posee la licencia BSD 
El código fuente está disponible y permite que se le hagan modificaciones y poder comercializarlo como software libre o privativo

Lo primero que haremos será descargar la imagen de CD de la de Minix
  • Web 
    • http://wiki.minix3.org/doku.php?id=inicio
  • Descarga
    • http://wiki.minix3.org/doku.php?id=www:download:start
  • Virtualización en VMWare
    • http://wiki.minix3.org/doku.php?id=usersguide:runningonvmware
Instalación: MDI-129 Sistemas de almacenamiento, tema2 MINIX
  • Arrancar con root
  • Teclear setup
  • Configurar
  • Instalar
Instalar paquetes:
  • pkgin install  nombrepaquete
  • pkgin install nano
Ejercicio:
  • Comprobar la estructura de directorios de este nuevo sistema de archivos
  • Estructura en: MDI-129 Sistemas de almacenamiento, tema2 MINIX
Migración de datos

La migración de datos en el contexto del sistema de ficheros consiste en transformar un sistema de ficheros en otro sin pérdida de datos
La migración es un proceso que con el tiempo es necesario llevar a cabo con todos los sistemas de ficheros
  • Mayor rendimiento/seguridad
  • Cambio de requisitos del usuario
  • Aumento volumen de datos
  • Fusión de varios sistemas
Para ver el sistema de archivos en WINDOWS:
  • Inicio
  • Herramientas administrativas
  • Administrador de equipos
  • Administrador de discos

Ejemplo conversión FAT, NTFS



Conversion FAT32 NTFS
https://www.youtube.com/watch?v=OgPCwahEXts&t=53s



Para ver el sistema de archivos en LINUX:
  • Inicio
  • Terminal
  • gp

Si no lo tenemos instalado:
  • sudo apt-get install gparted
Dar formato de linux EXT a NTFS

Lectura de un sistema de ficheros Linux desde un sistema de ficheros Windows
No se trata de una migración de datos

No hay comentarios:

Publicar un comentario