1. Класс StringTokenizer
И еще несколько самых частых сценариев работы со строками. Как разбить строку на несколько частей? Для этого есть несколько способов.
Метод split()
Первый способ разбить строку на несколько частей — использовать метод split()
. В него в качестве параметра нужно передать регулярное выражение: специальный шаблон строки-разделителя. Что такое регулярное выражение, вы узнаете в квесте Java Multithreading.
Пример:
Код | Результат |
---|---|
|
Результатом будет массив из трех строк:
|
Просто, но иногда такой подход избыточен. Если разделителей много, например, «пробел», «enter», «таб», «точка», приходится конструировать достаточно сложное регулярное выражение. Его сложно читать, а значит, в него сложно вносить изменения.
Класс StringTokenizer
В Java есть специальный класс, вся работа которого — разделять строку на подстроки.
Этот класс не использует регулярные выражения: вместо этого в него просто передается строка, состоящая из символов-разделителей. Преимущества этого подхода в том, что он не разбивает сразу всю строку на кусочки, а потихоньку идет от начала к концу.
Класс состоит из конструктора и двух основных методов. В конструктор нужно передать строку, которую мы разбиваем на части, и строку — набор символов, используемых для разделения.
Методы | Описание |
---|---|
|
Возвращает следующую подстроку |
|
Проверяет, есть ли еще подстроки. |
Этот класс чем-то напоминает класс Scanner
, у которого тоже были методы nextLine()
и hasNextLine()
.
Создать объект StringTokenizer
можно командой:
StringTokenizer имя = new StringTokenizer(строка, разделители);
Где строка — это строка
, которую будем делить на части. А разделители
— это строка, каждый символ которой считается символом-разделителем. Пример:
Код | Вывод на экран |
---|---|
|
|
Обратите внимание, что разделителем считается каждый символ строки, переданный второй строкой в конструктор StringTokenizer
.
2. Метод String.format()
и класс StringFormatter
И еще один интересный метод класса String — format()
.
Допустим, у вас есть различные переменные с данными. Как вывести их на экран одной строкой? Например, у нас есть данные (левая колонка) и желаемый вывод (правая колонка):
Код | Вывод на экран |
---|---|
|
|
Скорее всего, ваш код будет выглядеть примерно так:
Код программы |
---|
|
Такой код не слишком читабельный. Более того, если бы имена переменных были длиннее, код стал бы еще сложнее:
Код программы |
---|
|
Не очень читаемо, не так ли?
Однако в реальных программах такая ситуация встречается часто, поэтому я хочу рассказать о способе, как проще и короче записать этот код.
String.format
У класса String есть статический метод format()
: он позволяет задать шаблон объединения строки с данными. Общий вид этой команды такой:
String имя = String.format(шаблон, параметры);
Пример:
Код | Результат |
---|---|
|
|
|
|
|
|
В метод format()
первым параметром передают строку-шаблон, которая содержит весь нужный текст, а в местах, где нужно вставлять данные, написаны специальные символы типа %d
, %s
и т.п.
Вот эти %s
и %d
метод format()
и заменяют на параметры, которые идут следом за строкой-шаблоном. Если нужно подставить строку, мы пишем %s
, если число — %d
. Пример:
Код | Результат |
---|---|
|
s будет равна "a=1, b=4, c=3" |
Вот краткий список параметров, которые можно использовать внутри шаблона:
Символ | Обозначение |
---|---|
|
String |
|
целое число: byte , short , int , long |
|
вещественное число: float , double |
|
boolean |
|
char |
|
Date |
|
Символ % |
Эти параметры указывают на тип данных, но есть еще параметры, которые указывают на порядок данных. Чтобы взять параметр по его номеру (нумерация начинается с единицы), нужно записать %1$d
вместо %d
. Пример:
Код | Результат |
---|---|
|
s будет равна "a=13, b=12, c=11" |
%3$d
возьмет 3-й параметр-переменную, %2$d
возьмет второй параметр. %d
возьмет самый первый параметр-переменную. Параметры шаблона %s
, %d
обращаются к переменным-параметрам независимо от параметров шаблона типа %3$d
или %2$s
3. String Pool
Все строки, которые были заданы в коде в виде литералов, во время работы программы хранятся в памяти в так называемом StringPool
. StringPool
— это специальный массив для хранения строк. Цель его создания — оптимизация хранения строк:
Во-первых, строки, заданные в коде, нужно все-таки где-то хранить. Код — это команды, а данные (тем более такие большие как строки) нужно хранить в памяти отдельно от кода. В коде фигурируют только ссылки на объекты-строки.
Во-вторых, все одинаковые литералы можно хранить в памяти только один раз. Так оно и работает. Когда код вашего класса загружается Java-машиной, все строковые литералы добавляются в StringPool
, если их там еще нет. Если уже есть, просто используется ссылка на строку из StringPool
.
Поэтому если в своем коде вы присвоите нескольким String
-переменным одинаковые литералы, переменные будут содержать одинаковые ссылки. В StringPool
литерал будет добавлен только один раз, во всех остальных случаях будет браться ссылка на уже загруженную в StringPool
строку.
Как это примерно работает:
Код | Работа с StringPool |
---|---|
|
|
Именно поэтому переменные a
и b
будут хранить одинаковые ссылки.
Метод intern()
Ну и самое интересное: вы можете программно добавить любую строку в StringPool
. Для этого нужно просто вызвать метод intern()
у String
-переменной.
Метод intern()
добавит строку в StringPool
, если ее еще там нет, и вернет ссылку на строку из StringPool
.
Если в StringPool
добавить с помощью метода intern()
две идентичные строки, метод вернет одинаковые ссылки. Это можно использовать чтобы сравнивать строки по ссылке. Пример:
Код | Примечание |
---|---|
|
|
|
|
Вряд ли вы будете часто пользоваться этим методом, однако о нем любят спрашивать на собеседованиях, поэтому лучше о нем знать, чем не знать.
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ