JavaRush /Blog Java /Random-FR /Octets. Que lit-on dans le dossier ?
Roman
Niveau 33

Octets. Que lit-on dans le dossier ?

Publié dans le groupe Random-FR
En général, il s’agit d’informations destinées aux débutants. Lorsque le sujet de la lecture des informations d'un fichier a été abordé, la question s'est posée : si le fichier contient des lettres, alors pourquoi en lisons-nous des nombres sous forme d'octets et qu'est-ce qu'un octet dans ce cas ? Ce qu'est un octet a déjà été assez bien écrit ici. Mais, après lecture, la question du mécanisme de transformation des lettres en chiffres subsistait, j'ai donc dû creuser un peu plus sur Internet. Par conséquent, ce qui est écrit ci-dessous peut être considéré comme un ajout. L'ordinateur stocke chaque fichier sous forme d'informations composées de zéros et de uns sous forme binaire. Chaque fichier est en réalité une collection d’octets qui se succèdent. Généralement, il existe deux types de fichiers d'informations : un fichier texte et un fichier binaire. Le fichier texte contient un ensemble humain typique de caractères lisibles, que nous pouvons ouvrir dans n'importe quel éditeur de texte. Les fichiers binaires sont constitués de caractères que nous n'avons pas l'habitude d'utiliser dans la vie quotidienne, c'est pourquoi il faut un programme spécial pour les lire. Les fichiers texte sont constitués de lettres, de chiffres et d'autres caractères courants. Ces fichiers ont des extensions .txt, .py, .csv, etc. Lorsque nous ouvrons un tel fichier, nous voyons l'ensemble habituel de caractères qui forment les mots. Bien qu’en réalité ce contenu ne soit pas stocké sous cette forme à l’intérieur de l’ordinateur. Il est stocké sous forme de bits, c'est-à-dire 0 ou 1. Dans diverses tables de codage, ASCII, UNICODE ou une autre valeur de chaque caractère est définie sous forme binaire. En conséquence, si un octet peut contenir 256 caractères, alors chaque caractère a son propre codage binaire de zéros et de uns (huit zéros ou un écrits consécutivement donnent un caractère). Ainsi, à l'ouverture du fichier, l'éditeur de texte traduit chaque valeur ASCII en un caractère familier et l'affiche sous sa forme habituelle. Par exemple, au numéro 65 sous la forme binaire du code ASCII est 1000001, qui sera affiché dans le fichier avec la lettre latine (et non l'alphabet cyrillique. L'alphabet cyrillique commence à partir de la position 192) « A ». Autrement dit, dans le système ASCII, un octet avec la valeur 1000001 correspond à la valeur de la lettre latine « A ». Chaque ligne du fichier possède son propre saut de ligne – EOL (End of Line). Souvent ce caractère (deux caractères) est "\n" (valeur binaire en ASCII : 00001010). Après avoir lu un tel caractère, le programme l'interprète comme la fin de la ligne et une transition vers la ligne ci-dessous. Il existe d'autres « symboles fonctionnels » similaires. Les fichiers binaires, comme les fichiers texte, sont stockés sous forme binaire, mais ils ne sont pas « attachés » à un programme qui les décode, c'est-à-dire qu'il n'existe pas de table de décryptage de type ASCII. Fondamentalement, le contenu de ces fichiers est constitué d'images, d'audio et de vidéo, qui sont à leur tour des versions compressées d'autres fichiers, tels que des fichiers auto-exécutables (.exe). De tels fichiers (binaires) ne sont pas lisibles par les humains au sens habituel du terme, donc une tentative de les ouvrir avec des éditeurs de texte conventionnels affichera un tas de déchets incompréhensibles. En conséquence, des programmes spéciaux sont produits pour lire correctement ces fichiers. Les fichiers binaires sont également stockés sous forme d'une série d'octets, mais dans ce cas, la modification d'un seul bit peut rendre l'intégralité du fichier illisible. La table des caractères ASCII peut être consultée ici. Ainsi, lorsque nous lisons un fichier, 8 caractères (un ou zéro) sont lus dans la variable byte, qui peuvent ensuite être convertis par un programme comme le Bloc-notes en caractères lisibles. La source qui m'a aidé à le comprendre.
Commentaires
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION