JavaRush /Java Blog /Random-ID /Byte. Apa yang kita baca dari file tersebut?
Roman
Level 33

Byte. Apa yang kita baca dari file tersebut?

Dipublikasikan di grup Random-ID
Secara umum, ini adalah informasi untuk pemula. Ketika topik membaca informasi dari suatu file muncul, muncul pertanyaan: jika file tersebut berisi huruf, lalu mengapa kita membaca angka darinya dalam bentuk byte dan apa yang dimaksud dengan byte dalam kasus ini? Apa itu byte telah ditulis dengan cukup baik di sini. Namun setelah membaca, pertanyaan tentang mekanisme mengubah huruf menjadi angka masih tetap ada, sehingga saya harus menggali lebih dalam di Internet. Oleh karena itu, apa yang tertulis di bawah ini bisa dianggap sebagai tambahan. Komputer menyimpan setiap file sebagai informasi yang terdiri dari nol dan satu dalam bentuk biner. Setiap file sebenarnya adalah kumpulan byte yang mengikuti satu sama lain. Biasanya, ada dua jenis file informasi: file teks dan file biner. File teks berisi sekumpulan karakter yang dapat dibaca manusia, yang dapat kita buka di editor teks apa pun. File biner terdiri dari karakter-karakter yang tidak biasa kita operasikan dalam kehidupan sehari-hari, oleh karena itu diperlukan program khusus yang dapat membacanya. File teks terdiri dari huruf, angka, dan karakter umum lainnya. File tersebut memiliki ekstensi .txt, .py, .csv, dll. Saat kita membuka file seperti itu, kita melihat kumpulan karakter biasa yang membentuk kata-kata. Meskipun pada kenyataannya konten ini tidak disimpan dalam bentuk ini di dalam komputer. Itu disimpan dalam bentuk bit, yaitu 0 atau 1. Dalam berbagai tabel pengkodean ASCII, UNICODE atau nilai lain dari setiap karakter didefinisikan dalam bentuk biner. Oleh karena itu, jika satu byte dapat menampung 256 karakter, maka setiap karakter memiliki pengkodean binernya sendiri yang terdiri dari nol dan satu (delapan angka nol atau satu yang ditulis secara berurutan menghasilkan satu karakter). Jadi, saat file dibuka, editor teks menerjemahkan setiap nilai ASCII ke dalam karakter yang familiar dan menampilkannya dalam bentuk biasanya. Misalnya pada angka 65 dalam bentuk biner kode ASCII adalah 1000001, yang akan ditampilkan dalam file dengan huruf Latin (bukan alfabet Sirilik. Alfabet Sirilik dimulai dari posisi 192) huruf “A”. Artinya, dalam sistem ASCII, satu byte dengan nilai 1000001 sesuai dengan nilai huruf latin “A”. Setiap baris file memiliki jeda barisnya sendiri – EOL (End of Line). Seringkali karakter ini (dua karakter) adalah "\n" (nilai biner dalam ASCII: 00001010). Setelah membaca karakter seperti itu, program menafsirkannya sebagai akhir baris dan transisi ke baris di bawahnya. Ada "simbol fungsional" serupa lainnya. File biner, seperti file teks, disimpan dalam bentuk biner, tetapi tidak “dilampirkan” ke program yang menerjemahkannya, artinya, tidak ada tabel dekripsi tipe ASCII. Pada dasarnya, konten file tersebut adalah gambar, audio, dan video, yang merupakan versi terkompresi dari file lain, seperti file yang dapat dijalankan sendiri (.exe). File seperti itu (biner) tidak dapat dibaca oleh manusia seperti biasanya, jadi upaya untuk membukanya dengan editor teks konvensional akan menampilkan banyak sampah yang tidak dapat dipahami. Oleh karena itu, program khusus diproduksi untuk membaca file tersebut dengan benar. File biner juga disimpan sebagai serangkaian byte, tetapi dalam kasus ini, mengubah satu bit pun dapat membuat keseluruhan file tidak dapat dibaca. Tabel karakter ASCII dapat dilihat di sini. Jadi, ketika kita membaca sebuah file, 8 karakter (satu atau nol) dibaca ke dalam variabel byte, yang kemudian dapat diubah oleh beberapa program seperti Notepad menjadi karakter yang dapat dibaca. Sumber yang membantu saya mengetahuinya.
Komentar
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION