по
Историческая информатика
12+
Меню журнала
> Архив номеров > Рубрики > О журнале > Авторы > О журнале > Требования к статьям > Порядок рецензирования статей > Ретракция статей > Этические принципы > Политика открытого доступа > Оплата за публикации в открытом доступе > Online First Pre-Publication > Политика авторских прав и лицензий > Политика цифрового хранения публикации > Политика идентификации статей > Политика проверки на плагиат > Редакция > Редакционный совет
Журналы индексируются
Реквизиты журнала

ГЛАВНАЯ > Вернуться к содержанию
Статьи автора Галушко Илья Николаевич
Историческая информатика, 2023-1
Галушко И.Н. - Корректировка результатов OCR-распознавания текста исторического источника с помощью нечетких множеств (на примере газеты начала XX века) c. 102-113

DOI:
10.7256/2585-7797.2023.1.40387

Аннотация: Наша статья посвящена попытке применения современных методов NLP для оптимизации процесса распознавания текста исторических источников. Любой исследователь, решивший воспользоваться инструментами распознавания отсканированных текстов, столкнется с рядом ограничений точности конвейера (последовательности операций распознавания). Даже наиболее качественно обученные модели могут давать существенную ошибку по причине неудовлетворительного состояния дошедшего до нас источника: порезы, изгибы, кляксы, стертые буквы – всё это мешает качественному распознаванию. Наше предположение состоит в том, что, используя заранее заданный набор слов, маркирующих присутствие интересующей нас темы, с помощью модуля нечетких множеств (Fuzzy sets) из NLP-библиотеки SpaCy, мы сможем восстановить по шаблонам те слова, которые по итогам процедуры распознавания оказались распознаны с ошибками. Для проверки качества процедуры восстановления текста на выборке из 50 номеров газеты «Биржевые ведомости» мы посчитали оценки количества слов, которые бы не вошли в семантический анализ из-за неправильного распознавания. Все метрики были посчитаны также с использованием паттернов нечетких множеств. Оказалось, что в среднем на номер «Биржевых ведомостей» приходится 938.9 слов, маркирующих тему нашего исследования – торговые и финансовые операции с ценными бумагами. Из них изначально правильно распознаются в среднем 87.2% слов. Примерно 119.6 слов (в среднем на 50 номеров) содержат опечатки, связанные с некорректным распознаванием. Благодаря использованию алгоритмов нечетких множеств нам удалось эти слова восстановить и включить в семантический анализ. Мы считаем, что восполнение 12.8% слов, потенциально относящихся к изучаемой теме – это хороший результат, существенно повышающий качество дальнейшего семантического анализа текста методами компьютерного моделирования.
Историческая информатика, 2021-2
Галушко И.Н. - Опыт применения контент-анализа для исследования экономического мышления крупного биржевого игрока на Санкт-Петербургском фондовом рынке в начале XX века: И.П. Манус и «поведенческие финансы» c. 204-220

DOI:
10.7256/2585-7797.2021.2.36032

Аннотация: Данная работа посвящена изучению экономического мышления биржевых спекулянтов на Санкт-Петербургской бирже в начале ХХ века. Мы исследуем, как участники рынка анализировали фундаментальные (или экономические) и спекулятивные / иррациональные факторы ценообразования для принятия торгового решения. Наше внимание сосредоточено на способах восприятия рынка его агентами. В нашем исследовании для анализа источника мы используем методы контент-анализа и сетевого анализа с целью создать матрицу авторского восприятия через выявление связей между категориями экономического мышления. Основная идея данной работы состоит в обращении к уровню принятия торгового решения: на историческом материале, описывающем биржевую жизнь в Российской империи начала XX в., мы постараемся понять, как участник торгов концептуализировал в своём экономическом мышлении процесс функционирования фондового рынка. По итогам исследования были сформулированы два ключевых вывода. Согласно представлениям И.П. Мануса, фундаментальные факторы экономического процесса являются частью концепта совершенной экономики, к которой реальная экономика стремится как к идеалу. Главным искажением, не дающим этой утопии сбыться, выступает, по Манусу, человеческий фактор: желание легких денег, толкающее на финансовое преступление; искусственно поддерживаемая асимметрия информации; глупость и эмоциональность «толпы», выступающей вечной жертвой циничного спекулянта и т.п. В то же время оказалось, что всякая спекулятивная стратегия предполагает, в рефлексивной модели Мануса, эксплуатацию фундаментальных механизмов (таких как «ликвидность» или «объем предложения») через создание барьеров для функционирования совершенной экономики.
Другие сайты издательства:
Официальный сайт издательства NotaBene / Aurora Group s.r.o.