JavaRush /Java Blog /Random-TL /Bytes. Ano ang binabasa natin mula sa file?
Roman
Antas

Bytes. Ano ang binabasa natin mula sa file?

Nai-publish sa grupo
Sa pangkalahatan, ito ay impormasyon para sa mga nagsisimula. Kapag ang paksa ng pagbabasa ng impormasyon mula sa isang file ay lumitaw, ang tanong ay lumitaw: kung ang file ay naglalaman ng mga titik, kung gayon bakit namin binabasa ang mga numero mula dito sa anyo ng mga byte at ano ang isang byte sa kasong ito? Ang isang byte ay naisulat na nang maayos dito. Ngunit, pagkatapos basahin, ang tanong ng mekanismo para sa pagbabago ng mga titik sa mga numero ay nanatili pa rin, kaya kinailangan kong maghukay ng mas malalim sa Internet. Samakatuwid, ang nakasulat sa ibaba ay maaaring ituring na karagdagan. Iniimbak ng computer ang bawat file bilang impormasyon na binubuo ng mga zero at isa sa binary form. Ang bawat file ay talagang isang koleksyon ng mga byte na sumusunod sa isa't isa. Karaniwan, mayroong dalawang uri ng mga file ng impormasyon: isang text file at isang binary file. Ang text file ay naglalaman ng tipikal na hanay ng tao ng mga nababasang character, na maaari naming buksan sa anumang text editor. Binubuo ang mga binary file ng mga character na hindi namin ginagamit sa pang-araw-araw na buhay; samakatuwid, ang isang espesyal na programa ay kinakailangan na maaaring basahin ang mga ito. Ang mga text file ay binubuo ng mga titik, numero at iba pang karaniwang character. Ang mga nasabing file ay may mga extension na .txt, .py, .csv, atbp. Kapag binuksan namin ang naturang file, makikita namin ang karaniwang hanay ng mga character na bumubuo ng mga salita. Bagaman sa katotohanan ang nilalamang ito ay hindi nakaimbak sa form na ito sa loob ng computer. Ito ay naka-imbak sa anyo ng mga bit, iyon ay, 0 o 1. Sa iba't ibang mga encoding table ASCII, UNICODE o ilang iba pang halaga ng bawat karakter ay tinukoy sa binary form. Alinsunod dito, kung ang isang byte ay maaaring humawak ng 256 na mga character, ang bawat karakter ay may sariling binary encoding ng mga zero at isa (walong magkakasunod na nakasulat na mga zero o mga isa ay nagbibigay ng isang character). Kaya, kapag binuksan ang file, isinasalin ng text editor ang bawat halaga ng ASCII sa isang pamilyar na karakter at ipinapakita ito sa karaniwang anyo nito. Halimbawa, sa numero 65 sa binary form ng ASCII code ay 1000001, na ipapakita sa file na may Latin (hindi Cyrillic alphabet. Cyrillic alphabet ay nagsisimula sa posisyon 192) letter "A". Iyon ay, sa sistema ng ASCII, ang isang byte na may halagang 1000001 ay tumutugma sa halaga ng Latin na titik na "A". Ang bawat linya ng file ay may sariling line break – EOL (End of Line). Kadalasan ang character na ito (dalawang character) ay "\n" (binary value sa ASCII: 00001010). Ang pagkakaroon ng nabasa tulad ng isang character, ang programa ay binibigyang-kahulugan ito bilang dulo ng linya at isang paglipat sa linya sa ibaba. May iba pang katulad na "functional symbols". Ang mga binary file, tulad ng mga text file, ay naka-imbak sa binary form, ngunit hindi sila "naka-attach" sa isang program na nagde-decode sa kanila, iyon ay, walang ASCII-type na decryption table. Karaniwan, ang nilalaman ng naturang mga file ay mga larawan, audio at video, na kung saan ay mga naka-compress na bersyon ng iba pang mga file, tulad ng mga self-executing file (.exe). Ang ganitong mga file (binary) ay hindi nababasa ng mga tao sa karaniwang kahulugan, kaya ang isang pagtatangka na buksan ang mga ito gamit ang maginoo na mga text editor ay magpapakita ng isang bungkos ng hindi maintindihan na basura. Alinsunod dito, ang mga espesyal na programa ay ginawa upang basahin nang tama ang mga naturang file. Ang mga binary file ay iniimbak din bilang isang serye ng mga byte, ngunit sa kasong ito, ang pagbabago ng kahit isang bit ay maaaring gawing hindi nababasa ang buong file. Ang talahanayan ng karakter ng ASCII ay maaaring tingnan dito. Kaya, kapag nagbasa tayo ng file, 8 character (isa o zero) ang binabasa sa byte variable, na maaaring i-convert ng ilang program tulad ng Notepad sa mga nababasang character. Ang pinagmulan na tumulong sa akin na malaman ito.
Mga komento
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION