JavaRush /Blog Jawa /Random-JV /Byte. Apa sing kita maca saka file kasebut?
Roman
tingkat

Byte. Apa sing kita maca saka file kasebut?

Diterbitake ing grup
Umumé, iki minangka informasi kanggo pamula. Nalika topik maca informasi saka file muncul, pitakonan muncul: yen file kasebut ngemot huruf, banjur kenapa kita maca angka kasebut ing bentuk bita lan apa bait ing kasus iki? Apa byte wis ditulis cukup apik kene. Nanging, sawise maca, pitakonan babagan mekanisme ngowahi huruf dadi angka isih tetep, mula aku kudu digali luwih jero ing Internet. Mula apa kang kaserat ing ngisor iki bisa dianggep tambahan. Komputer nyimpen saben file minangka informasi sing dumadi saka nol lan siji ing wangun binar. Saben file sejatine minangka kumpulan bita sing ngetutake saben liyane. Biasane, ana rong jinis file informasi: file teks lan file binar. File teks kasebut ngemot set karakter khas manungsa sing bisa diwaca, sing bisa dibukak ing editor teks apa wae. File binar kalebu karakter sing ora biasa digunakake ing saben dinane, mulane, program khusus dibutuhake sing bisa maca. File teks kalebu huruf, angka lan karakter umum liyane. File kasebut duwe ekstensi .txt, .py, .csv, lsp. Nalika mbukak file kasebut, kita ndeleng set karakter biasa sing mbentuk tembung. Senajan ing kasunyatan isi iki ora disimpen ing wangun iki nang komputer. Iki disimpen ing wangun bit, yaiku, 0 utawa 1. Ing macem-macem tabel enkoding ASCII, UNICODE utawa sawetara nilai liyane saben karakter ditetepake ing wangun binar. Dadi, yen bait bisa ngemot 256 karakter, saben karakter nduweni enkoding binar dhewe saka nol lan siji (wolung angka nul sing ditulis kanthi berturut-turut utawa siji menehi siji karakter). Mangkono, nalika file dibukak, editor teks nerjemahake saben nilai ASCII menyang karakter akrab lan nampilake ing wangun biasanipun. Contone, ing nomer 65 ing wangun binar kode ASCII punika 1000001, kang bakal ditampilake ing file karo Latin (ora aksara Cyrillic. Cyrillic aksara wiwit saka posisi 192) huruf "A". Yaiku, ing sistem ASCII, bait kanthi nilai 1000001 cocog karo nilai huruf Latin "A". Saben baris file duwe break baris dhewe - EOL (End of Line). Asring karakter iki (loro karakter) yaiku "\n" (nilai binar ing ASCII: 00001010). Sawise maca karakter kasebut, program kasebut napsirake minangka pungkasan baris lan transisi menyang baris ing ngisor iki. Ana liyane padha "simbol fungsional". File binar, kaya file teks, disimpen ing wangun binar, nanging ora "ditempelake" ing program sing nerjemahake kode kasebut, yaiku, ora ana tabel dekripsi jinis ASCII. Sejatine, isi file kasebut yaiku gambar, audio lan video, sing uga minangka versi kompres file liyane, kayata file sing bisa dieksekusi dhewe (.exe). File kasebut (biner) ora bisa diwaca dening manungsa ing pangertèn sing biasa, mula nyoba mbukak karo editor teks konvensional bakal nampilake akeh sampah sing ora bisa dingerteni. Mulane, program khusus diprodhuksi kanggo maca file kasebut kanthi bener. File binar uga disimpen minangka seri bita, nanging ing kasus iki, ngganti malah siji bit bisa nggawe kabeh file ora bisa diwaca. Tabel karakter ASCII bisa dideleng ing kene. Mangkono, nalika maca file, 8 karakter (siji utawa nol) diwaca menyang variabel byte, sing banjur bisa diowahi dening sawetara program kaya Notepad dadi karakter sing bisa diwaca. Sumber sing mbantu aku ngerteni.
Komentar
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION