Основное предназначение компьютерных программ - обработка данных.
Чтобы обработать данные нужно их как-то хранить. Предлагаю разобраться с тем, как происходит хранение данных.
Переменные
Переменные (variables) - это контейнеры, которые хранят какие-либо данные.
Посмотрим официальный Tutorial от Oracle : Declaring Member Variables.
Согласно данному Tutorial, существует несколько типов переменных:
Поля (fields) : переменные, объявленные в классе;
Локальные переменные (local variables) : переменные в методе или в блоке кода;
Параметры (parameters) : переменные в объявлении метода (в сигнатуре).
Все переменные должны иметь тип переменной и название переменной.
Тип переменной показывает, какие данные представляет данная переменная (т.е. какие данные может хранить). Как мы знаем, тип переменной может быть примитивным (primitives primitives) или объектным, не примитивными (Non-primitive). При объектных переменных их тип описывается определённым классом.
Название переменной должно быть с маленькой буквы, в camel case. Подробнее про именование можно прочитать в "Variables:Naming".
Так же если переменная уровня класса, т.е. является полем класса, то для неё может указываться модификатор доступа. Подробнее см. Controlling Access to Members of a Class.
Объявление переменной (Declaration)
Итак, мы вспомнили, что такое переменная. Для того, чтобы с переменной начать работать нужно её объявить. Для начала, разберёмся с локальной переменной.
Вместо IDE для удобства воспользуемся онлайн решением от tutorialspoint: Online IDE. Выполним в их online IDE вот такую простенькую программку:
public class HelloWorld{
public static void main(String []args){
int number;
System.out.println(number);
}
}
Итак, как видно, мы объявили локальную переменную с именем number и типом int. Нажимаем кнопку «Execute» и получаем ошибку:
HelloWorld.java:5: error: variable number might not have been initialized
System.out.println(number);
Что же произошло? Мы объявили переменную, но значение её не инициализировали. Стоит заметить, что ошибка эта произошла не в момент выполнения (т.е. не в Runtime), а в момент компиляции. Умный компилятор проверил, будет ли локальная переменная инициализирована до обращения к ней или нет.
Поэтому, из этого следует следующие утверждения:
Обращение к локальным переменным должно быть выполнено только после того, как они будут инициализированы;
Локальные переменные не имеют значений по умолчанию;
Проверка значений локальных переменных выполняется в момент компиляции.
Итак, нам говорят, что переменная должна быть проинициализирована.
Инициализация переменной – присвоение переменной значения. Давайте тогда разбираться, что это и почему.
Инициализация локальной переменной
Инициализация переменных одна из самых мудрёных тем в Java, т.к. очень тесно связана с работой с памятью, с реализацией JVM, спецификацией JVM и другими не менее страшными и хитрыми вещами. Но можно попробовать разобраться хоть в какой-то мере. Пойдём от простого к сложному.
Чтобы инициализировать переменную воспользуемся оператором присваивания и изменим строчку в нашем прошлом коде:
int number = 2;
В таком варианте ошибок не будет и на экран выведется значение.
Что же происходит в этом случае? Давайте попробуем порассуждать. Если мы хотим присвоить переменной какое-то значение, значит мы хотим, чтобы эта переменная хранила значение. Получается, что значение где-то должно храниться, но где? На диске? Но это очень медленно и может на нас накладывать ограничения. Получается, единственное, где мы можем быстро и эффективно хранить данные «здесь и сейчас» это память. Значит, нам нужно выделить в памяти какое-то место.
Так и есть. При инициализации переменной под неё будет выделено место в памяти, отведённой java процессу, в рамках которого будет выполняться наша программа. Память, выделяемая java процессу, разделена на несколько областей или зон. В какой из них будет выделено место зависит от того, какого типа была объявлена переменная.
Память разделяется на следующие разделы: Heap, Stack и Non-Heap.
Начнём со стэковой памяти. Stack переводится как стопка (например, стопка книг). Представляет собой LIFO структуру данных (Last In, First Out). То есть как стопка книг. Когда мы добавляем в неё книги – мы кладём их сверху, а когда забираем – берём верхнюю (т.е. ту, которая добавлена самой последней).
Итак, мы запускаем нашу программу. Как мы знаем, Java программу выполняет JVM, то есть виртуальная Java машина. JVM должна знать то, откуда должно начаться выполнение программы. Для этого мы объявляем main метод, который называется «точкой входа». Для выполнения в JVM создаётся основной поток (Thread). При создании потока ему выделяется свой стэк в памяти. Этот стэк состоит из фрэймов. При выполнении каждого нового метода в потоке под него будет выделен новый фрэйм и добавлен на вершину стэка (как новая книжка в стопке книг). Этот фрэйм будет содержит ссылки на объекты и примитивные типы. Да да, наш int будет храниться в стэке, т.к. int это примитивный тип. Прежде чем выделить фрэйм JVM должна понимать, что туда сохранять. Именно по этой причине мы получим ошибку «variable might not have been initialized», ведь если она не инициализирована, то JVM не сможет нам подготовить стэк. Поэтому при компиляции программы умный компилятор поможет нам не допустить ошибку и не сломать всё.
(!) Для наглядности советую супер-пупер статью: "Java Stack and Heap: Java Memory Allocation Tutorial".
В ней ссылаются на не менее крутое видео:
После завершения выполнения метода из стэка потока будут удаляться фрэймы, выделенные под эти методы, а вместе с ними и очищаться память, выделенная под этот фрэйм со всеми данными.
Инициализация локальных объектных переменных
Давайте опять изменим наш код на чуть более хитрый:
public class HelloWorld{
private int number = 2;
public static void main(String []args){
HelloWorld object = new HelloWorld();
System.out.println(object.number);
}
}
Что же тут будет происходить?
Давайте ещё раз рассуждать. JVM узнает о том, откуда ей выполнять программу, т.е. она видит main метод. Она создаёт поток, под него выделяет память (потоку ведь надо где-то хранить данные, которые нужны для выполнения). В этом потоке выделяется фрэйм под метод main. Далее мы создаём объект HelloWorld. Этот объект уже создаётся не в стэке, а в хипе. Потому что object у нас не примитивный тип, а объектный. А в стэке будет храниться только ссылка на объект в хипе (мы ведь как-то должны обращаться к этому объекту). Далее в стэке метода main будут выделены фрэймы для выполнения метода println. После выполнения метода main будут уничтожены все фрэймы. При уничтожении фрэйма будут уничтожены все данные. Объект object не будет уничтожен сразу. Сначала на него будет уничтожена ссылка и таким образом на объект object больше никто ссылаться не будет и доступа больше к этому объекту в памяти будет не получить. Умная JVM имеет свой механизм для такого – сборщик мусора (garbage collector или сокращённо GC). Он то и удаляет из памяти такие объекты, на которые больше никто не ссылается.
Данный процесс опять же был описан в ссылке, что была приведена выше. Там даже видео есть с объяснением.
Инициализация полей
Инициализация полей, указанных в классе происходит особым образом в зависимости от того, является ли поле статическим или нет. Если у поля стоит ключевое слово static, то данное поле относится к самому классу, а не слово static не указано, то данное поле относится к экземпляру класса. Давайте рассмотрим это на примере:
public class HelloWorld{
private int number;
private static int count;
public static void main(String []args){
HelloWorld object = new HelloWorld();
System.out.println(object.number);
}
}
В данном примере, инициализация полей происходит в разное время. Поле number будет инициализировано после того, как будет создан объект object класса HelloWorld. А вот поле count будет инициализировано тогда, когда класс будет загружен виртуальной Java машиной. Загрузка классов – это отдельная тема, поэтому не будем сюда примешивать её. Просто стоит знать, что статические переменные инициализируются тогда, когда о классе становится известно при выполнении.
Тут важнее другое и Вы уже это заметили. Мы нигде не указали значения, а оно работает. И действительно. Переменные, которые являются полями, если для них не указано значение, то они инициализируются значением по умолчанию. Для числовых значением это 0 или 0.0 для чисел с плавающей точкой. Для boolean это false. А для всех переменных объектных типов значение будет null (об этом мы ещё поговорим).
Казалось бы, а почему так? А потому, что объекты создаются в Heap (в куче). Работа с данной областью выполняется в Runtime. И мы в runtime можем инициализировать эти переменные, в отличии от стэка, память под который должна быть подготовлена ещё до выполнения. Так устроена работа с памятью в Java.
Но есть тут и ещё одна особенность. В этом маленьком кусочке затрагиваются разные уголки памяти. Как мы помним, в Stack памяти под метод main выделяется фрэйм. В этом фрэйме хранится ссылка (reference) на объект в Heap памяти. Но где тогда хранится count? Как мы помним, эта переменная инициализируется сразу, до создания объекта в хипе. Вот тут действительно хитрый вопрос. До Java 8 существовала область памяти, называемая PERMGEN. Начиная с Java 8 эта область претерпела изменения и называется METASPACE. По сути, статические переменные являются частью описания класса, т.е. его метаданными. Поэтому, логично, что хранится в хранилище метаданных, METASPACE. MetaSpace относится к той самой Non-Heap области памяти, является её частью.
Важно ещё учитывать то, что учитывается порядок, в котором объявлены переменные. Например, в этом коде ошибка:
public class HelloWorld{
private static int b = a;
private static int a = 1;
public static void main(String []args){
System.out.println(b);
}
}
Что такое null
Как было сказано выше, переменные объектных типов, если они являются полями класса, инициализируются значениями по умолчанию и таким значением по умолчанию является null. Но что же такое null в Java?
Первое что важно помнить – примитивные типы не могут быть null. А всё потому, что null – это особенная ссылка (reference), которая не ссылается никуда, ни на какой объект. Поэтому, только объектная переменная может быть равна null.
Второе, что важно понимать, что null – это ссылка, reference. Я reference тоже имеют свой вес. На эту тему можно почитать вопрос на stackoverflow: "Does null variable require space in memory".
Блоки инициализации
Рассматривая инициализацию переменных грех не рассмотреть блоки инициализации. Выглядит это следующим образом:
public class HelloWorld{
static {
System.out.println("static block");
}
{
System.out.println("block");
}
public HelloWorld () {
System.out.println("Constructor");
}
public static void main(String []args){
HelloWorld obj = new HelloWorld();
}
}
Порядок вывода будет: static block, block, Constructor. Как мы видим, блоки инициализации выполняются раньше, чем конструктор. И иногда это может быть удобным средством для инициализации.
Заключение
Надеюсь, этот небольшое обзор смог привнести понимание того, как это работает и почему.
#Viacheslav
Все равно не понятно, почему "Локальные переменные не имеют значений по умолчанию", сделали бы чтобы имели значения по умолчанию и ошибки бы не было на этапе компиляции....
Не совсем понял про память, чтобы переменная сохранила значение, но где хранила? На диске? Но это очень медленно, получается чтоб использовать значение переменной мы сохраняем его в памяти (да понятно что в памяти, а где еще можна сохранить?). Ну а где эта память физически находиться? Имеется ввиду оперативная память, или кэш процессора ? Или может в САТА шлейфе, тот что с синей обмоткой?
"Проверка значений локальных переменных выполняется в момент компиляции" - неверно,в момент компиляции только проверяется,чтобы все переменные были инициализированы
Переменные типа int способны хранить целые числа в диапазоне от -2 миллиарда до +2 миллиарда. Или, если быть более точным, то от -2,147,483,648 до 2,147,483,647.
С документацией Oracle не поспоришь, но тут тоже есть интересное дополнение к данной статье:
Переменные экземпляра
- Переменные экземпляра объявляются в классе, но за пределами метода, конструктора или какого-либо блока.
- Когда для объекта в стеке выделяется пространство, создается слот для каждого значения переменной экземпляра.
- В Java переменные экземпляра создаются тогда, когда объект создан с помощью ключевого слова «new» и разрушаются тогда, когда объект уничтожается.
- Переменные содержат значения, которые должны ссылаться более чем на один метод, конструктор или блок, или на основные части состояния объекта, которые должны присутствовать на протяжении всего класса.
- Переменные экземпляра могут быть объявлен на уровне класса, до или после использования.
-Модификаторы доступа могут быть предоставлены для переменных экземпляра.
- Переменные экземпляра в Java являются видимыми для всех методов, конструкторов и блоков в классе. Как правило рекомендуется сделать их private (уровень доступа). Однако можно сделать их видимыми для подклассов этих переменных с помощью модификаторов доступа.
- Переменные экземпляра имеют значения по умолчанию. Для чисел по умолчанию равно 0, для логических — false, для ссылок на объект — null. Значения могут быть присвоены при объявлении или в конструкторе.
- Переменные экземпляра в Java могут быть доступны непосредственно путем вызова имени переменной внутри класса. Однако в статических методах и различных класса (когда к переменным экземпляра дана доступность) должны быть вызваны используя полное имя — ObjectReference.VariableName.
Ниже можно почитать про переменные класса и в чем отличие их от переменных экземпляра
http://proglang.su/java/variable-types
Простыми словами "значение по умолчанию" - это какое-то значение (к примеру для int = 0 то есть целое число, для String = null если я не ошибаюсь) которое присваивается переменным автоматически если вы сами не указали никакого значения. Такое "значение по умолчанию" есть только для переменных экземпляра. Для локальных переменных такого значения нет, по этому перед использованием ЛОКАЛЬНОЙ переменной ДОЛЖНО быть присвоено ей какое-либо значение. Для переменной ЭКЗЕМПЛЯРА такое значение НЕ ОБЯЗАНО быть присвоенным, но тогда у неё будет "значение по умолчанию" (для каждого типа переменной уже заданы:
-для ссылочных переменных это null;
-для числовых это 0 или 0.0, в зависимости от типа.
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ