Передача знания и Нейронный машинный перевод на практике
Нейронный машинный перевод (НМП, англ. Neural Machine Translation, NMT) развивается очень быстро. Сегодня, чтобы собрать свой переводчик, не нужно иметь два высших образования. Но чтобы обучить модель, нужен большой параллельный корпус (корпус, в котором предложению на исходном языке сопоставлен его перевод). На практике речь идет хотя бы об одном миллионе пар предложений. Есть даже отдельная большая область НМП, исследующая методы обучения языковых пар с малым количеством данных в электронном виде (англ. Low Resource NMT).
Мы собираем чувашско-русский корпус и параллельно смотрим, что можно сделать с имеющимся объемом данных. В этом примере использовали корпус из 90 000 пар предложений. Самый хороший результат на данный момент дал метод передачи знания (англ. Transfer Learning), о нем и пойдет речь в статье. Цель статьи — дать практический пример реализации, который легко можно было бы воспроизвести.
План обучения таков. Нужно взять большой (родительский) корпус, обучить на нем нейронную модель, а затем дообучить нашу дочернюю модель. Причем целевой язык перевода будет один и тот же: русский. Интуитивно это можно сравнить с изучением второго языка. Его учить легче, зная один иностранный язык. Еще это похоже на изучение узкой области иностранного языка, например, медицинской терминологии английского языка: сначала нужно выучить английский в общем.
В качестве родительского корпуса пробовали брать 1 миллион пар предложений из англо-русского параллельного корпуса и 1 миллион из казахско-русского корпуса. В казахских данных 5 миллионов предложений. Из них взяли только те, у которых коэффициент соответствия (третья колонка) больше 2. Казахский вариант дал результаты чуть лучше. Интуитивно кажется, что это понятно, поскольку чувашский и казахский языки более похожи друг на дурга. Но на самом деле это не доказано, а также сильно зависит от качества корпуса. Более подробно про подбор родительского корпуса можно прочесть в этой статье. Про дочерний корпус из 90 000 пар предложений узнать и запросить пример данных можно тут.
Теперь к коду. Если нет своей быстрой видеокарты, можно тренировать модель на площадке Colab. Для обучения мы использовали библиотеку Sockeye. Предполагается, что уже установлен Python3.
pip install sockeye
Также возможно отдельно придется повозиться с MXNet , которая отвечает за работу с видеокартой. В Colab нужно дополнительно установить библиотеку
pip install mxnet-cu100mkl
Про нейронные сети принято считать, что им достаточно скормить данные как есть, а они сами разберутся. Но на самом деле это не всегда так. Вот и в нашем случае корпус нужно предобработать. Сначала его токенизируем, чтобы модели легче было понимать, что «кот!» и «кот» — это примерно про одно и тоже. Для примера подойдет просто питоновский токенайзер.
from nltk.tokenize import WordPunctTokenizer def tokenize(src_filename, new_filename): with open(src_filename, encoding="utf-8") as src_file: with open(new_filename, "w", encoding="utf-8") as new_file: for line in src_file: new_file.write("%s" % ' '.join(WordPunctTokenizer().tokenize(line))) new_file.write("\n")
В результате, подаем на вход пары предложений вида
Нумаях пулмасть вӗсене те укҫа тӳлеме пӑрахнӑ. Республикӑра пурӑнакансем хӑйсен хастарлӑхӗпе, ырӑ кӑмӑлӗпе, чунтан тухакан йӑл куллипе тӗлӗнмелле лару-тӑру йӗркелерӗҫ, ют ҫӗршыври пирӗн ӗҫтешсем палӑртнӑ тӑрӑх, ҫавнашкалли вӗсен патӗнче Раштав уявне паллӑ тунӑ вӑхӑтра кӑна пулать.
Недавно им тоже перестали платить деньги. Своим оптимизмом, добротой, приветливыми улыбками жители республики создали удивительную атмосферу, которая, по словам зарубежных партнеров, бывает у них только во время празднования Рождества.
На выходе получаются такие токенизированные предложения:
Нумаях пулмасть вӗсене те укҫа тӳлеме пӑрахнӑ . Республикӑра пурӑнакансем хӑйсен хастарлӑхӗпе , ырӑ кӑмӑлӗпе , чунтан тухакан йӑл куллипе тӗлӗнмелле лару - тӑру йӗркелерӗҫ , ют ҫӗршыври пирӗн ӗҫтешсем палӑртнӑ тӑрӑх , ҫавнашкалли вӗсен патӗнче Раштав уявне паллӑ тунӑ вӑхӑтра кӑна пулать .
Недавно им тоже перестали платить деньги . Своим оптимизмом , добротой , приветливыми улыбками жители республики создали удивительную атмосферу , которая , по словам зарубежных партнеров , бывает у них только во время празднования Рождества .
В нашем случае понадобятся объединенные словари родительского и дочернего корпусов, поэтому создадим общие файлы:
cp kk.parent.train.tok kkchv.all.train.tok cat chv.child.train.tok >> kk.parent.train.tok cp ru.parent.train.tok ru.all.train.tok cat ru.child.train.tok >> ru.all.train.tok
так как дообучение дочерней модели происходит на том же словаре.
Теперь небольшое, но важное отступление. В МП предложения разбивают на атомы в виде слов и далее оперируют предложениями как последовательностями слов. Но этого как правило недостаточно, потому что образуется огромный хвост из слов, которые встречаются в корпусе по одному разу. Построить для них вероятностную модель сложно. Особенно это актуально для языков с развитой морфологией (падеж, род, число). И русский, и чувашский именно такие языки. Но есть решение. Можно разбить предложение на более низкий уровень, на подслова. Мы использовали Byte pair encoding.
git clone https://github.com/rsennrich/subword-nmt.git
Получим примерно такие последовательности подслов
Ну@@ маях пулмасть вӗсене те укҫа тӳ@@ леме пӑрахнӑ . Республи@@ кӑра пурӑнакансем хӑйсен хастар@@ лӑхӗпе , ырӑ кӑмӑ@@ лӗпе , чунтан тухакан йӑ@@ л кул@@ липе тӗлӗнмелле лару - тӑ@@ ру йӗркеле@@ рӗҫ , ют ҫӗршыв@@ ри пирӗн ӗҫ@@ те@@ шсем палӑртнӑ тӑрӑх , ҫав@@ наш@@ ка@@ лли вӗсен патӗнче Ра@@ шта@@ в уя@@ вне паллӑ тунӑ вӑхӑтра кӑна пулать .
Не@@ давно им тоже пере@@ стали пла@@ тить деньги . Сво@@ им о@@ пти@@ ми@@ з@@ мом , добро@@ той , привет@@ ли@@ выми улыб@@ ками жители республики соз@@ дали уди@@ витель@@ ную ат@@ мо@@ с@@ фер@@ у , которая , по сло@@ вам за@@ ру@@ бе@@ жных па@@ рт@@ не@@ ров , бывает у них только во время празд@@ но@@ вания Ро@@ ж@@ де@@ ства .
Видно, что из слов хорошо вычленяются аффиксы: Не@@ давно и добро@@ той.
Для этого нужно подготовить словари bpe
python subword-nmt/subword_nmt/learn_joint_bpe_and_vocab.py --input kkchv.all.train.tok ru.all.train.tok -s 10000 -o bpe.codes --write-vocabulary bpe.vocab.kkchv bpe.vocab.ru
И применить их к токенам, например:
python subword-nmt/subword_nmt/apply_bpe.py -c bpe.codes --vocabulary bpe.vocab.kkchv --vocabulary-threshold 50 < kkchv.all.train.tok >kkchv.all.train.bpe !python subword-nmt/subword_nmt/apply_bpe.py -c bpe.codes --vocabulary bpe.vocab.ru --vocabulary-threshold 50 < ru.all.train.tok >ru.all.train.bpe
По аналогии нужно сделать для всех файлов: обучающих, валидационных и тестовых родительской и дочерней моделей.
Теперь перейдем непосредственно к обучению нейронной модели. Сначала нужно подготовить общие модельные словари:
python -m sockeye.prepare_data -s kk.all.train.bpe -t ru.all.train.bpe -o kkru_all_data
Далее обучим родительскую модель. Более подробно простой пример описан на странице Sockeye. Технически процесс состоит из двух шагов: подготовки данных с использованием созданных ранее модельных словарей
python -m sockeye.prepare_data -s kk.parent.train.bpe -t ru.parent.train.bpe -o kkru_parent_data --source-vocab kkru_all_data/vocab.src.0.json --target-vocab kkru_all_data/vocab.trg.0.json
и самого обучения
python -m sockeye.train -d kkru_parent_data -vs kk.parent.dev.bpe -vt ru.parent.dev.bpe --encoder transformer --decoder transformer --transformer-model-size 512 --transformer-feed-forward-num-hidden 256 --transformer-dropout-prepost 0.1 --num-embed 512 --max-seq-len 100 --decode-and-evaluate 500 -o kkru_parent_model --num-layers 6 --disable-device-locking --batch-size 1024 --optimized-metric bleu --max-num-checkpoint-not-improved 10
Обучение на мощностях Colab занимает около суток. Когда тренировка модели завершена, переводить с ее помощью можно так
python -m sockeye.translate --input kk.parent.test.bpe -m kkru_parent_model --output ru.parent.test_kkru_parent.bpe
Для обучения дочерней модели выполним
python -m sockeye.prepare_data -s chv.child.train.bpe -t ru.child.train.bpe -o chvru_child_data --source-vocab kkru_all_data/vocab.src.0.json --target-vocab kkru_all_data/vocab.trg.0.json
Код запуска обучения выглядит так
python -m sockeye.train -d chvru_child_data -vs chv.child.dev.bpe -vt ru.child.dev.bpe --encoder transformer --decoder transformer --transformer-model-size 512 --transformer-feed-forward-num-hidden 256 --transformer-dropout-prepost 0.1 --num-embed 512 --max-seq-len 100 --decode-and-evaluate 500 -o ruchv_150K_skv_dev19_model --num-layers 6 --disable-device-locking --batch-size 1024 --optimized-metric bleu --max-num-checkpoint-not-improved 10 --config kkru_parent_model/args.yaml --params kkru_parent_model/params.best
Добавляются параметры, указывающие, что нужно использовать конфигурацию и веса родительской модели в качестве точки старта. Детали в примере с дообучением от Sockeye. Обучение дочерней модели сходится примерно за 12 часов.
Подводя итоги, сравним результаты. Обычная модель машинного перевода дала качество 24,96 BLEU, тогда как модель с передачей знания 32,38 BLEU. Разница видна и визуально на примерах переводов. Поэтому, пока продолжаем собирать корпус, будем пользоваться этой моделью.
- нейронный перевод
- нейронные сети
- transfer learning
- чувашский язык
- sockeye
- colab
- Алгоритмы
- Big Data
- Машинное обучение
ПЕРЕДАЧА ЗНАНИЙ В КОНТЕКСТЕ ОНЛАЙН-БАЗИРУЮЩЕГОСЯ ОБУЧЕНИЯ: СУЩНОСТЬ, СОДЕРЖАНИЕ, ОСОБЕННОСТИ Текст научной статьи по специальности «Науки об образовании»
ВИРТУАЛЬНЫЕ СООБЩЕСТВА / ЗНАНИЯ / УПРАВЛЕНИЕ ЗНАНИЯМИ / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / ОНЛАЙН-БАЗИРУЮЩЕЕ ОБУЧЕНИЕ / СОЦИАЛЬНЫЕ КОММУНИКАЦИИ / VIRTUAL COMMUNITIES / KNOWLEDGE / KNOWLEDGE MANAGEMENT / INFORMATION TECHNOLOGIES / ONLINE EDUCATION / SOCIAL COMMUNICATIONS
Аннотация научной статьи по наукам об образовании, автор научной работы — Глузман Неля Анатольевна
В представленном исследовании введены основные определения, проанализированы существующие направления и концепции в сфере управления знаниями в контексте онлайн-базирующегося университетского образования. Приведены обобщения того, что сегодня следует понимать под концепцией Web и WWW в контексте унифицированной среды обучения, какую роль в нем играет информационное и программное обеспечение социальных коммуникаций . Рассмотрены и интерпретированы концепции в области виртуальных социальных сообществ. Проанализированы необходимые производства, которые применяются в сфере программного обеспечения и систем информационного обеспечения виртуальных сообществ . Показано, что современный уровень информационных технологий не позволяет интерпретировать феномен виртуальных социальных сообществ в контексте исключительно обмена знаниями между участниками в рамках определенного учебного процесса или курса как вида деятельности с жестким контролем и регулированием.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Похожие темы научных работ по наукам об образовании , автор научной работы — Глузман Неля Анатольевна
ПРОБЛЕМЫ В ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ (НА МАТЕРИАЛЕ АНГЛИЙСКОЙ ИДИОМАТИКИ)
Генезис теоретических идей управления знаниями
Отношение между явным и неявным знанием
Формирование новых кросс-каналов в условиях взаимодействия знаний и информационных технологий
Цифровизация экономики на основе совершенствования экспертных систем управления знаниями
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.
KNOWLEDGE TRANSFER IN THE CONTEXT OF ONLINE-BASED LEARNING: ESSENCE, CONTENT, FEATURES
The presented study introduces significant definitions and analyzes the existing trends and concepts in the field of knowledge management in the general context of online university-based education. It is made the explanation of the fact what we should understand today under the Web and WWW-concepts in the context of unified learning and work environments. Also it is determined the role of informational and software tools in the context of social communica-tions. Several concepts from the field of social virtual communities were considered and interpreted. The necessary definitions and tools were analyzed, which are applied in the field of software and informational support systems for virtual communities . It is shown that the modern level of information technology does not allow to interpret the phe-nomenon of virtual social communities in the context of knowledge sharing between participants, as a process with rigorous control and regulation.
Текст научной работы на тему «ПЕРЕДАЧА ЗНАНИЙ В КОНТЕКСТЕ ОНЛАЙН-БАЗИРУЮЩЕГОСЯ ОБУЧЕНИЯ: СУЩНОСТЬ, СОДЕРЖАНИЕ, ОСОБЕННОСТИ»
организационные, мотивационные аспекты, регулирующие образовательную деятельность в рамках овладения иноязычной компетенцией. Будущие врачи должны быть мотивированы к изучению иностранного языка путем активного общения с педагогом, который является авторитетом и источником для получения не только новейших знаний, но и источником приобретения принципиально новых воззрений [4].
Речевая коммуникация сегодня является основой взаимодействия многих и многих специалистов. Причём это взаимодействие может происходить не только в поле их профессиональной деятельности, Но и за её пределами. Для этого важно понимать, С какой целью проводится коммуникация, каковы предполагаемые её результаты, а также её средства и формы. В связи с этим важно изучать не только специфику родного языка, носителями которого являются студенты-медики, но и уделять особое внимание иноязычным компетенциям, которые формируют личность как многоуровневую и структурно сложную единицу, способную не только выполнить социальный заказ и формировать принципиально новые способы оказаниея медицинских услуг, но и создавать новые концепции взаимодействия с другими врачами, которое может происходить на международном уровне с учетом межкультурных особенностей, изучению которых в ВУЗе должно быть уделено достаточное внимание.
Иностранный язык сегодня является проводником на международную арену не только конкретного специалиста, но и целого учебного заведения, и даже государства. Развитие медицины и смежных с ней областей приводит к необходимости проявления отечественных врачей на поприще международной медицины, что возможно исключительно посредством иноязычных компетенций.
Выводы. Исходя из результатов исследования, мы можем заключить, что коммуникативная профессиональная компетентность будущего врача складывается на этапе формирования его профориентационной грамотности и внедрения в коммуникационную систему внутри профессиональной деятельности. Формирование подобной компетентности должно происходить многоуровнево и посредством различных инновационных педагогических технологий, методов и средств, которыми в совершенстве должны владеть современные педагоги высшего медицинского учреждения. Исключительно посредством такого подхода возможно осуществление максимально эффективной и действенной организации и управления, регуляции и целесообразного контроля образовательной деятельности, а также взращивание профессионально грамотных специалистов, способных проявлять себя на международном уровне.
1. Ахмедова М.И., Карабаев М., Абдуманонов А.А. Особенности формирования информационных ресурсов для развития профессионально-ориентированных английских речевых компетенций студентов медицинских ВУЗов // Жур. ЗАРУБЕЖНАЯ ФИЛОЛОГИЯ. — Самарканд, 2009. — N 4 (33). — С. 57-61.
2. Ахмедова М.И., Абдуманонов А.А., Карабаев М. Электронная база данных санитарно-гигиенических терминов, текстов, диалогов и упражнений по формированию иноязычной профессиональной коммуникативной компетенции будущих специалистов студентов медико-профилактического профиля и тесты для оценки уровня усвоения требуемых компетенций. Свидетельство Патентной ведомстве Республики Узбекистан N VGU 00290 от 29.03.2012 г. об офицальном регистрации электронных баз данных.
3. Карабаев М., Абдуманонов А.А., Ахмедова М.И. Компьютерная программа для формирования иноязычной профессиональной коммуникативной компетенции студентов медиков. Свидетельство Патентной ведомстве Республики Узбекистан № DGU 02453 от 29.03.2012 г. об офицальном регистрации программы для ЭВМ.
4. Обдалова О.А., Гураль С.К. Концептуальные основы разработки образовательной среды для обучения межкультурной коммуникации // Язык и культура. 2012. № 4 (20). С. 83-96.
5. Соболева А.В., Обдалова О.А. Когнитивная готовность к межкультурному общению как необходимый компонент межкультурной компетенции // Язык и культура. 2015. № 1 (29). С 146-155.
УДК 372;378: [37] 147
доктор педагогических наук, профессор Глузман Неля Анатольевна
Евпаторийский институт социальных наук (филиал) федерального государственного автономного образовательного учреждения высшего образования «Крымский федеральный университет имени В.И. Вернадского» (г. Евпатория)
ПЕРЕДАЧА ЗНАНИЙ В КОНТЕКСТЕ ОНЛАЙН-БАЗИРУЮЩЕГОСЯ ОБУЧЕНИЯ: СУЩНОСТЬ,
Аннотация. В представленном исследовании введены основные определения, проанализированы существующие направления и концепции в сфере управления знаниями в контексте онлайн-базирующегося университетского образования. Приведены обобщения того, что сегодня следует понимать под концепцией Web и WWW в контексте унифицированной среды обучения, какую роль в нем играет информационное и программное обеспечение социальных коммуникаций. Рассмотрены и интерпретированы концепции в области виртуальных социальных сообществ. Проанализированы необходимые производства, которые применяются в сфере программного обеспечения и систем информационного обеспечения виртуальных сообществ. Показано, что современный уровень информационных технологий не позволяет интерпретировать феномен виртуальных социальных сообществ в контексте исключительно обмена знаниями между участниками в рамках определенного учебного процесса или курса как вида деятельности с жестким контролем и регулированием.
Ключевые слова: виртуальные сообщества, знания, управление знаниями, информационные технологии, онлайн-базирующее обучение, социальные коммуникации.
Annotation. The presented study introduces significant definitions and analyzes the existing trends and concepts in the field of knowledge management in the general context of online university-based education. It is made the explanation of the fact what we should understand today under the Web and WWW-concepts in the context of unified learning and work environments. Also it is determined the role of informational and software tools in the context of social communica-tions. Several concepts from the field of social virtual communities were considered and interpreted. The necessary definitions and tools were analyzed, which are applied in the field of software and
informational support systems for virtual communities. It is shown that the modern level of information technology does not allow to interpret the phe-nomenon of virtual social communities in the context of knowledge sharing between participants, as a process with rigorous control and regulation.
Keywords: virtual communities, knowledge, knowledge management, information technologies, online education, social communications.
Введение. В условиях современного постиндустриального общества знания являются основным фактором конкурентоспособности специалистов, предприятий и целых стран. С точки зрения экономических теорий именно знания являются определяющим фактором создания добавленной стоимости в условиях глобального аутсорсинга реального производства. В системе высшего образования рассмотрение процесса генерирования знаний в практически-ориентированном аспекте позволяет ведущим университетам выступать в роли равноправных партнеров для научно-исследовательского сотрудничества с ведущими промышленными компаниями. В контексте задач, которые сегодня ставятся перед современными университетами (особенно в контексте концепции дуального образования) большое значение приобретает не только сам процесс передачи знаний как вид «трансляции информации» аудитории, но и типы и способы усвоения знаний как важные шаги подготовки студентов к будущей профессиональной деятельности. Поэтому одной из основных задач, стоящих в настоящее время перед современными вузами, является создание определенной среды (в нашем случае — виртуальной), в которой знания будут эффективно распространяться и развиваться.
Процесс передачи знаний является актуальным и важным в учебном процессе высших учебных заведений в современных условиях постинформационного общества. Поэтому многие отечественные и зарубежные исследователи уделяют внимание этим проблемам в своих работах. Так, современные перспективы внедрения информационных технологий в процесс передачи знаний в высших учебных заведениях рассматривают в своих работах ученые О.В. Акулова, А.А. Андреев, В.И. Богословский, Л.Л. Босова, В.П. Меркулов, Т.Н. Носкова, Г.К. Селевко, В.А. Ситаров, Г.В. Тараканов, А.И. Шутенко и др. Ряд ученых в своих работах исследуют особенности электронного обучения в контексте информационной среды высшей школы, в частности (А.Г. Абросимов, Привалов А.Н., Богатырева Ю.И., Романов В.А. [2] и др.). Работы зарубежных исследователей (H. Berends [5]; N.-I. Boer [6]; R. Maier [8]; H. Maurer [9]; M. Nissen [10]; I. Nonaka [11]) на которые опирается автор статьи, охватывают в основном программно-технические вопросы управления знаниями в образовательном процессе.
Цель статьи заключается в анализе составляющих элементов процесса передачи знаний в сфере онлайн-базирующего университетского образования и применения их в контексте новых научно-педагогических условий постинформационного общества.
Изложение основного материала статьи. Сегодня уровни обучения и управления знаниями (реальный и виртуальный) не должны рассматриваться как отдельные друг от друга, наоборот, стоит акцентировать внимание на связях и особенностях управления знаниями на обоих уровнях. Анализ исследований в этой сфере (N.-I. Boer [6]; N.A. Gluzman [7]; R. Maier [8]) свидетельствует о том, что управление знаниями следует рассматривать как вид комплексного и междисциплинарного задания, включающего, помимо технических и организационных составляющих частей, еще и функции создания, использования, архивации и распределения (трансляции) знаний. Это требует тщательного анализа конкретных областей применения, технологических аспектов организации процессом управления знаниями, а также субъективных характеристик его участников.
Следует подчеркнуть, что с началом эры информационных технологий значение соответствующих инструментов и средств информационных технологий рассматривался как первоочередное, важное и успешное решение данной задачи. После прохождения волны ИТ-эйфории оказалось, что основным элементом решения проблем управления знаниями является прежде всего основательность анализа предметной области применения и выделения основных факторов, влияющих на эффективность и оптимальность имеющихся социальных коммуникаций. Так, в сфере университетского образования основным социокоммуникативным фактором дистанционного обучения является физическое расстояние между участниками учебного процесса, что обосновывает незаменимость информационного посредничества средствами информационных технологий в процессе коммуникации «Студент — преподаватель» (Н.А. Глузман [1]). В то же время, если есть возможность традиционной консультации («живая консультация»), то ни информационное посредничество в режимах онлайн или оффлайн не способно ее заменить [4].
Считается, что приобретут максимальное распространение именно ИТ-ориентированные профессии с переходом веб-сообществ на уровень семантического интернета (WEB 3.0) [13].
Несмотря на важность привязки к предметной области в целом, именно ИТ-средства сегодня являются унифицированными и универсальными инструментами архивации знаний, сортировки их по уровням релевантности, формирование целевых групп с соответствующим уровнем удовлетворения информационных потребностей в данных и знаниях. Из вышеуказанного следует исключительная значимость ИТ-средств для процесса поддержки и передачи знаний в контексте университетского образования.
В процессе обучения студенты уже оперируют информационно-программными инструментами, которые они будут использовать в будущей профессиональной деятельности (например, средства Microsoft Office, MS Word, MS Excel, MS PowerPoint и т.д.). Важным является то, что эти же средства использует и преподаватель для передачи знаний в форме программно-информационных сущностей (например, в форме визуально-электронных слайдов презентации MS PowerPoint).
Понятно, что эффективное достижение целей учебного процесса по опосредованному использованию ИТ-средств возможно только при условии их максимально адекватного использования без перегруженности сути знаний формой их представления. Такая ситуация объясняется тем, что потенциальную пользу и эффективность возможных и ожидаемых педагогических ситуаций невозможно заранее детально спланировать, как и спрогнозировать соотношение ожидаемого и фактического педагогических эффектов от определенного вида знаний или форм их представления (H. Berends [5]; N.-I. Boer [6]). Эти факторы имеют временную привязанность, основанную на эффекте взаимосвязи действий «преподаватель — студент» в каждый момент времени.
Формирование глубокого понимания проблем управления знаниями возможно после детального анализа научно-педагогических условий формирования и передачи знаний, а также педагогических когнитивных аспектов самой сущности знаний.
В условиях университетского образования достаточно сложно создать систему ограничений или соответствующих граничных условий, которые обеспечивают положительную мотивацию студентов для максимально эффективного восприятия и усвоения знаний. Традиционно знания делятся на явные и неявные (D. Paulin, K. Suneson [12]). С точки зрения информационных технологий такое разделение важно потому, что явные знания можно легко представить средствами информационных технологий путем их выражения через инструменты семантических формальных языков программирования высокого уровня, таких как: Prolog, Java, Lisp, Ruby-on-rails и др.
В противоположность явным знаниям, неявные знания в значительной степени интуитивны, контекстно специфические. Их достаточно сложно кодировать; программно передавать все тонкости семантических оттенков на уровне формальной логики, лежащей в основе классических и новейших языков программирования (R. Maier [8]). Однако важным и сложным моментом является то, что создание новых знаний состоит в эффективном сочетании как явных, так и неявных знаний (например, в границах какой-то модели, ассоциации и т.п.). Именно это является причиной, которая сдерживает развитие искусственного интеллекта, основанного на известных информационно-программных средствах, поскольку знания для компьютера должны быть сведены к тому или иному программному коду (D. Paulin, K. Suneson [12]). Поэтому именно явные знания позволяют охватить содержание учебного материала путем выделения релевантных отличий на основе заданных предпочтений выбора. А неявные знания представляют собой способности интуитивного выделения отличий на основе заданных преимуществ, в частности, и в будущей учебной деятельности, с целью получения реальных практических результатов. Следовательно, можно утверждать, что явные знания являются небольшой частью надстройки над общей структурой неявных знаний. Данные средства позволяют получить модели неявных знаний с определенной степенью достоверности. Однако, проблема заключается в том, что компьютер не может оперировать с нечеткостью и вероятностью на уровне процессора. Поэтому во время компьютерной реализации любая нечеткая модель неявных знаний должна быть приведена к соответствующей четкой модели путем потери точности, адекватности и релевантности знаний в целом (N.-I. Boer [6]; R. Maier [8]; M. Nissen [10]).
В представленных источниках (H. Berends [5]; N.-I. Boer [6]; M. Nissen [10]; D. Paulin, K. Suneson [12]) нет четкого распределения между понятиями «передача знаний» и «обмен знаниями». Близкими в данном контексте является понятие «расширение знаний» («диффузия знаний»), «распространение знаний», «распределение знаний», «поток знаний» (D. Paulin, K. Suneson [12]). В контексте поставленной задачи исследования важным является разграничение понятий «передача знаний» и «обмен знаниями». Эффективным процесс передачи знаний является тогда, когда у студентов возникает реальная потребность в знаниях в форме запроса на новые знания, а не просто желание получить положительную оценку или зачет, продемонстрировав преподавателю результаты усвоения новых знаний. В отличие от данных, для которых основная операция заключается в успешном копировании, знания адаптируются под имеющийся учебный профиль студента, что требует больших усилий.
В источниках (R. Maier [8]; M. Nissen [10]; I. Nonaka [11]) рассматривается ряд моделей передачи знаний. Среди них известная японская модель передачи знаний (I. Nonaka [11]), согласно которой неуспевающие студенты приобретают необходимые знания от успешных студентов, которые такие знания уже усвоили и успешно используют их на практике. Близкой к этой модели является модель «усвоенных уроков» (M. Nissen [10]), суть которой заключается в том, что из каждого успешного проекта отдельного класса выделяется базовая сущность в форме экспертного опыта, представленного в форме отчета. Эту модель можно рассматривать как вид модели обучения на примерах, которые часто используются при изучении информационных технологий.
Основная сложность такого подхода заключается в чрезмерной субъективности и временно-затратной процедуре выделения экспертного опыта в форме сжатых отчетов. Однако, если предметную область (учебный курс) рассматривать как конечный набор определенных учебных проблем, то в совокупности они являются попарно различными только по некоторым уровням сходства и идентичности, что существенно затрудняет сравнение таких проблем во временной динамике. Сама сущность знаний слишком динамична, а наполнение знаний может меняться. Например, в момент чтения лекции или во время выхода учебника (что можно наблюдать в предметной области информационных технологий).
Следовательно, передача знаний включает в себя технологические, промышленные и творческие аспекты и контенты коммуникации. Например, на промышленном уровне речь идет не только о передаче знаний от одного работника к другому (происходит на одном уровне профессиональной коммуникации или на разных — от руководителя до исполнителя), а также о передаче знаний от уровня корпоративного сервера к авторизованному пользователю.
Под передачей знаний понимают ненаправленное одностороннее сообщение знаний, в форме потока знаний в направлении от отправителя к получателю, который эти знания письменно фиксирует; одновременно наличие обратной связи необязательно (D. Paulin, K. Suneson [12]). Примером такой передачи знаний является передача косвенного сообщения от лектора к студентам путем, например, размещения слайдов к лекции на сайте преподавателя. Преподаватель может выставлять другие дополнительные онлайн-материалы из учебного курса, поскольку студент может не иметь прямого коммуникационного контакта с лектором (как во время дистанционного обучения). А лектор, в свою очередь, не получает обратной связи по определению уровня качества и восприятия определенной части знаний студентом. Обратная связь может быть налажена только на этапе тестирования уровня усвоенных знаний, умений и навыков.
Следовательно, передача знаний может происходить в форме личного контакта или в электронно-виртуальной форме. Методы такой передачи знаний должны быть оценены преподавателем комплексно в процессе передачи определенного учебного материала, с одной стороны, а с другой — необходимо оценить способности конкретной учебной аудитории или отдельных студентов. Процесс передачи знаний в рамках университетского образования следует рассматривать в следующих направлениях:
— от преподавателя к одному или нескольким студентам;
— от одного или нескольких студентов к одному или нескольким студентам;
— от одного или нескольких студентов к преподавателю в форме обратной связи (R. Maier [8]).
Процесс передачи знаний может происходить различными способами: прямо или косвенно; явно и неявно; в форме личного контакта или в электронной форме (виртуально); синхронно и асинхронно; в урегулированной обязательной форме или на основе самоконтроля во время сессии; управляемый как пользователем, так и удаленным администратором (H. Berends [5]; N.-I. Boer [6]; D. Paulin, K. Suneson [12]). Итак, мы получаем последовательность процессов с определенной степенью противопоставления:
1) прямая передача знаний в противовес косвенной передачи знаний;
2) скрытая передача знаний в противовес явной;
3) ИТ-основанная передача знаний в противовес личному контакту;
4) синхронная и асинхронная;
5) детерминирована и добровольная;
6) самоорганизация процесса передачи знаний в противовес внешнему администрированию (H. Berends [5]; N.-I. Boer [6]; R. Maier [8]).
Анализ таких противопоставлений позволяет выделить основные формы процесса передачи знаний как прямого, так и не прямого. Если прямая передача знаний между источником знаний и получателем происходит в форме личного контакта, то таким образом передачу знаний следует рассматривать как вид коммуникации в режиме «с глазу на глаз». Для эффективного протекания данного процесса важно наличие у источника и получателя некоторых общих контекстных знаний, которые формируются в процессе совместного обучения и являются частью опыта совместной работы над проектами. И наоборот, при косвенной передаче знаний наличие общего контекста знаний не является важным, поскольку источник и получатель знаний связываются с помощью определенного веб-базирующегося техничного средства, такого как: Moodle, Facebook, Twitter, Viber, Skype, Telegram и т.д.
В результате сравнения возможностей, преимуществ и недостатков прямого и косвенного способов передачи знаний сам процесс передачи знаний можно разделить на две основные категории:
1) неявная передача знаний — передача знаний происходит путем коммуникации между лицами в формах неформальной беседы, тренингов (в том числе и на рабочем месте). Во время неявной коммуникации процесс передачи знаний в режиме «с глазу на глаз» осуществляется путем интерпретации жестов, мимики партнера и т.п.;
2) явная передача знаний — процесс передачи знаний происходит в форме «новостной» коммуникации, где все участники понимают суть процесса передачи знаний (H. Berends [5]; N.-I. Boer [6]; D. Paulin, K. Suneson [12]).
Следовательно, можно утверждать, что явная передача знаний включает в себя средства экстернализации знаний (например, знания представляются на бумаге, формируются в виде электронного документа, который может быть распечатан или распространен в сети) и средства интернализации знаний (например, формирование учебника, документирование программного проекта и т.д., то есть то, что может быть прочитанным и понятым). В процессе передачи знаний в явной (письменной) форме параллельно происходит развитие составляющих знаний, которые могут быть использованы другими виртуальными сообществами или лицами в границах определенной организации, в рамках корпоративной локальной сети (что также может рассматриваться как вид Intranet).
После проведенного анализа временных аспектов передачи знаний целесообразно исследование различий в способах передачи знаний в контексте их синхронности и асинхронности. С технической точки зрения синхронная передача знаний происходит в форме кратковременного соединения событий передачи и получения информации (R. Maier [8]; M. Nissen [10]). При асинхронной передаче знаний наличие такого соединения не является существенным (например, гипертекстовые веб-основанные системы). Суть гипертекстовой асинхронности заключается в том, что отправитель размещает информацию на сервере, а получатель загружает эту информацию в онлайн-режиме в удобное для себя время средством проводного, беспроводного или мобильного доступа (R. Maier [8]; M. Nissen [10]). В сфере высшего образования преподаватель регулирует данный процесс путем установления прав доступа (авторизация), а также может осуществлять автоматизированный контроль статистики и персонализации процесса загрузки с целью дополнительного контроля учебной активности студентов и организации форм и средств контроля знаний. Отдельным видом автоматизированного процесса асинхронной передачи знаний является выполнение так называемых рассылок. В нашем случае речь идет о том, что зарегистрированный студент не сам загружает какую-то информацию, а получает ее на персональный e-mail как разновидность «подписки». При таком способе передачи знаний учитывается не отдельный получатель, а совокупность таких получателей (группа студентов).
Исходя из контекста данного исследования (а именно области университетского образования), следует рассмотреть добровольные и принудительные формы процесса передачи знаний, проанализировать различия, преимущества и недостатки этих процессов. Передача знаний в учебной среде осуществляется средствами социально ориентированного программного обеспечения такими как блоги и вики и осуществляется на добровольной основе. Принудительная составляющая такого процесса будет заключаться в обязательном участии студентов в тематических дискуссионных форумах, где преподаватель выступает в роли модератора и оценивает студентов по уровню их активности на форуме, корректности, полноты и ценности их сообщений. Важно, что такие форумы как средство коммуникации могут создавать ситуации оживленных дискуссий, что требует значительных усилий преподавателя в роли модератора, в то же время активные участники таких дискуссий не всегда имеют позитивную мотивацию к такому участию (может иметь место целенаправленный троллинг и спаминг с целью заработать высокий рейтинг).
Стоит выделить особенности процесса самоорганизации и внешнего администрирования процессов передачи знаний. Суть самоорганизации процесса передачи знаний заключается в том, что он осуществляется без внешнего воздействия, как при добровольной передаче знаний. В случае внешнего администрирования процесс передачи знаний предусматривает вмешательство внешних модераторов и администраторов, которые рассматриваются как необходимая составляющая такого процесса. В некоторых сферах университетского образования (например, в ИТ-сфере) такие вмешательства могут быть полезными в процессах инсталяции, компиляции и т.д., а проявления таких вмешательств иметь вид онлайн-сопровождения.
Выводы. Итак, большинство современных компьютерных способов передачи знаний, таких как WWW, группы новостей, дискуссионные форумы, e-mail-системы, блоги и т.д., являются асинхронными способами
передачи знаний. Данные результаты являются прямым следствием технологии «клиент-сервер», которая является основополагающей информационной технологией в развитии WWW и Интернет. Вместе с тем следует отметить, что приведенные инструменты не исключают применения синхронных способов передачи знаний в режиме «с глазу на глаз», но уже на новом компьютерно-базированном веб-уровне. Сегодня такие технологии распространяются в форме учебных вебинаров, научно-практических видеоконференций, систем мгновенных сообщений, чатов и т.п.
1. Глузман Н.А. Становление и развитие информационной культуры будущих учителей начальных классов / Н.А. Глузман // Информатика и образование. — 2018. — № 2 (291). — С. 51-58.
2. Привалов А.Н., Богатырева Ю.И., Романов В.А. Инжиниринговый центр как инновационный компонент профессиональной подготовки бакалавров IT-направлений // Образование и наука. 2019. Т. 21 № 7. С. 90-112.
3. Привалов А.Н., Романов В.А., Китаев А.А. Информационные технологии и информационно-образовательная среда педагогического вуза / А.Н. Привалов, В.А. Романов, А.А. Китаев // Молодежь. Образование. Наука. — 2017. — Т. 1. — № 1-1. — С. 46-52.
4. Романов В.А. Состояние и перспективы подготовки преподавателей вузов к работе в условиях дистанционного обучения / В.А. Романов // Материали за 7-а Международна научна практична конференция «Настоящи изследвания и развитие» — 17-25 януари 2011 г.» — 2011. Том 9. Педагогические науки. София. «Бял ГРАД-БГ» ООД — С. 3-5.
5. Berends H., Bij H. van der, Debackere K., Weggeman M. Knowledge sharing mechanisms in industrial research. Working Paper. 04.04. Eindhoven Centre for Innovation Studies. Eindhoven, 2004. URL: http://citeseerx.ist.psu.edu/ viewdoc/download?doi=10.1.1.112.5668&rep=rep1&type=pdf
6. Boer N.-I., Baalen P.J. van, Kumar K. The importance of sociality for understanding knowledge sharing processes in organizational contexts. 2002. ERIM Report Series, ERS-2002-05-LIS, ERIM, Rotterdam. URL: https://www.researchgate.net/publication/4864215_The_Importance_of_Sociality_for_Understanding_Knowledge_S haring_Processes_in_Organizational_Contexts.
7. Gluzman, N.A., Zhelnina, E.V., Yavon, S.V., (. ), Akhmetzhanova, G.V., Gorbacheva, N.B. Educational environment in the information society as an efficient indicator of the provision of high level of design solutions and technologies // Advances in Intelligent Systems and Computing, 1100 AISC, 2020 — С. 778-791.
8. Maier R. Knowledge Management Systems. Information and Communication Technologies for Knowledge Management. 2 ed. 2004. Berlin: Springer.
9. Maurer H., Tochtermann K. On a New Powerful Model for Knowledge Management and its Applications. Journal of Universal Computer Science. 2002. Vol. 8. №1. P. 85-96. URL: https://www.researchgate.net/publication/220348532_ On_a_New_Powerful_ Model_for_Knowledge_Management_and_its_Applications
10. Nissen M. An extended model of knowledge-flow dynamics. Communications of the Association for Information Systems. 2002. Vol. 8. P. 251-266. URL: https:// pdfs.semanticscholar.org/4ec1/12d488ff93cb5bb66fc2dd10f312 bc45b29e.pdf.
11. Nonaka I., Takeuchi H. The Knowledge Creating Company: How Japanese companies create the dynamics of innovation. 1995. Oxford University Press, NY.
12. Paulin D., Suneson K. Knowledge Transfer, Knowledge Sharing and Knowledge Barriers — Three Blurry Terms in KM. The Electronic Journal of Knowledge Management. 2012. Vol. 10. Issue 1. P. 81-91. URL: https:// pdfs.semanticscholar.org/c795/63fff0200a42141249 aa11bfd481ff6ac03f.pdf
13. Romanov V.A. The use of information and communication technologies to solve educational problems in primary school (Использование информационно-коммуникационных технологий для решения образовательных задач в начальной школе) / V.A. Romanov // Уральский научный вестник. Volume 1. № 1.: Изд-во: ТОО «Уралнаучкнига» (Уральск, Казахстан). — 2019. — С. 26-30.
кандидат филологических наук, доцент Градская Татьяна Вячеславовна
Нижегородский государственный лингвистический университет имени Н.А. Добролюбова(г. Нижний Новгород)
ПРОБЛЕМЫ В ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ (НА МАТЕРИАЛЕ АНГЛИЙСКОЙ ИДИОМАТИКИ)
Аннотация. В статье акцентируется значимость лингвокультурного аспекта обучения студентов языкового вуза иностранному языку. Развитие умения студентов общаться на изучаемом ими языке чрезвычайно важно для осуществления межкультурной коммуникации, участники которой принадлежат к разным языковым социумам.
Ключевые слова: межкультурная коммуникация, коммуникативная компетенция, идиома, интерференция, контекст.
Annotation. In this paper the emphasis is placed on the importance of teaching language students a foreign language through the prism of culture-related notions. Enhancing the students’ ability to communicate in this particular language is of paramount importance for it enables them to successfully converse in cross-cultural communication whose participants belong to different language communities.
Keywords: cross-cultural communication, communicative competence, idiom, interference, context.
Введение. В задачи настоящей статьи не входит освещение глобальных проблем современного педагогического образования. Речь пойдет о проблемах, с которыми чаще всего сталкиваются изучающие английский язык, и, в частности, студенты языкового вуза.
Автор задается целью поделиться результатами проведенного научного компаративного исследования в области английской идиоматики, которые могут способствовать повышению качества обучения английскому
Понимаем сленг программистов: мини-словарь для начинающих разработчиков

Начинающие разработчики не сразу понимают старших товарищей. Фразы вроде «я апишку свитчнул» или «заимпорти другую либу» звучат для новичков как лекция по математическому анализу для первобытного человека. Поэтому мы решили сделать небольшой словарь профессионального сленга программистов.
Слова и фразы в словаре отсортированы по алфавиту. Кстати, словарь можно дополнять. Пишите в комментариях термины, с которыми вы сталкивались на работе.
Бесплатные курсы по программированию в Хекслете
- Освойте азы современных языков программирования
- Изучите работу с Git и командной строкой
- Выберите себе профессию или улучшите навыки

А
Адаптив — адаптивный дизайн, адаптация интерфейса к использованию на разных экранах.
Аджайл — от англ. Agile. Общий термин, который описывает ценности и принципы гибкой разработки программного обеспечения, а также практические подходы к разработке. Понятие Agile стало популярным после публикации Манифеста гибкой разработки программного обеспечения в 2001 году.
Айдишник — id, идентификатор.
Альфа — этап разработки программного обеспечения, на котором разработчики добавляют в программу новые функции, а тестировщики испытывают программу. Это внутренний или непубличный этап.
Апишка — API, программный интерфейс приложения или интерфейс прикладного программирования.
Апрув, апрувнуть — от англ. Approve. Одобрение, одобрить, утвердить.
Аутсорс — аутсорсинг, передача компанией части операционной деятельности другой компании.
Б
Баг — от англ. Bug — жучок, клоп. Ошибка в программе.
Бахнуть — что-то быстро сделать, изменить или дополнить функциональность приложения.
Бета — бета-версия, приложение на стадии публичного тестирования.
Бот — сокращение от «робот». Ботом называют программу, которая автоматизирует интерфейс. Пример — автоответчик в чате.
Бэкап, бэкапить — резервная копия или процесс создания резервной копии приложения.
Бэкенд — от англ. Back-end. Программно-аппаратная или серверная часть приложения.
Бэклог — от англ. Backlog. Перечень рабочих задач команды разработчиков, упорядоченный по приотритету.
В
Ворнинг — от англ. Warning — предупреждение. Предупреждающее сообщение в интерфейсе.
Войтивайти — шуточное выражение, обозначает процесс переквалификации далекого от IT-сферы специалиста в разработчика.
Выкатить — сделать доступным для пользователей. Например, «выкатили новую версию сайта» значит сделали новую версию сайта доступной для пользователей.
Выпадашка — выпадающее меню, то же, что и «дропдаун».
Г
Галера — компания, в которой платят низкие зарплаты и не ценят разработчиков.
Гит — система контроля версий Git или сервис GitHub.
Г****окод — плохой, некачественный код. Объяснение термина есть в статье нашего студента.
Градиент — плавный переход из одного цвета в другой.
Грумить — от англ. Grooming. Приводить в порядок, «причесывать».
Д
Движок — в веб-разработке так называют системы управления контентом.
Дебажить — устранять ошибки, баги.
Деплой, деплоить — развёртывание, публикация рабочей версии приложения. Пример: задеплоить сайт — перенести сайт с тестового на рабочий сервер, сделать его доступным для пользователей.
Джун, джуниор — от англ. Junior. Младший разработчик. Специалист без опыта или с минимальным опытом работы.
Дезигнер — презрительно-снисходительное название дизайнера.
Докеризировать — завернуть приложение в докер (платформу для разработки, доставки и запуска контейнерных приложений).
Драй — от англ. DRY, don’t repeat yourself. Принцип программирования, предлагающий избегать повторений кода.
Дропдаун — выпадающее меню, то же, что и «выпадашка».
Дропнуть — от англ. Drop. Удалить, отключить, сбросить или обнулить что-либо.
Ж
Жаба — язык программирования Java.
Жабаскрипт — язык программирования JavaScript.
З
Залить — загрузить. Например, «залить файлы на сервер».
Запилить — сделать что-то, добавить какую-то функциональность.
Змея — язык программирования Python.
И
Исходник — файлы, в которых находится исходный код приложения, или сам исходный код.
Итерация — повторение. «Мы сделали несколько итераций» — мы повторили шаг несколько раз.
Бесплатные курсы по программированию в Хекслете
- Освойте азы современных языков программирования
- Изучите работу с Git и командной строкой
- Выберите себе профессию или улучшите навыки

К
Колл — от англ. Call. Созвон, онлайн-конференция, онлайн-совещание.
Коммит, коммитить — от англ. To commit — совершать. В контексте работы над приложением — сохранять код в репозитории.
Копипаста — от англ. Copy-Paste. Скопированный откуда-то код.
Костыль — код, который нужен, чтобы исправить несовершенство ранее написанного кода.
Л
Легаси — от англ. Legacy. Морально устаревший код, который не обновляется, но используется. Или код, который разработчик получил по наследству от предыдущих разработчиков.
Либа — от англ. Library — библиотека. Речь идет о библиотеках кода, например, React.
Линтер — общее нарицательное название программ, которые анализируют код и предупреждают разработчика об ошибках.
Лист — от англ. List — список.
Локалка — локальный. Например, локальный сервер или сеть.
М
Мидл — от англ. Middle — средний. Уровень разработчика, следующий за джуниором. Опыт и уровень знаний миддла позволяет ему самостоятельно решать серьезные задачи.
Мёржить — от англ. Merge, сливать. Речь идет об объединении или слиянии веток кода.
Меншить — от англ. Mention — упоминание. Упоминанать в чатах или соцсетях. «Менши меня, когда будет готово» значит «упомяни меня, когда будет готово».
Н
Навбар — навигационный блок на сайте или в интерфейсе программы.
Накатить — внести изменения, задеплоить новую версию приложения. Противоположное термину «откатить».
О
Опенсорс, опен-сорс — от англ. Open Source. Программное обеспечение с открытым исходным кодом.
Откатить — удалить изменения, вернуть предыдущую версию приложения. Противоположное термину «накатить».
Ось — операционная система.
П
Падаван — ироничное название стажера или джуниора.
Пилот — пробная (пилотная) версия продукта.
Питон — язык программирования Python.
Подвал — то же, что и «футер». Элемент структуры страницы, который находится в нижней части и содержит служебную информацию — контакты, ссылки на соцсети, публичная оферта и т. д.
Поплыла вёрстка — некорректное отображение страницы в браузере.
Продакшн или продакшен (продакшн-код) — обозначение кода для рабочей версии приложения.
Пушить — использовать команду push, публиковать что-то.
Пэхапэ — язык программирования PHP, то же, что и «пыха».
Пыха — язык программирования PHP, то же, что и «пэхапэ».
Р
Рекурсия — описание процесса с помощью самого процесса. Например, выражение «рекурсивный вызов функции» описывает ситуацию, в которой функция вызывает сама себя.
Релиз — программное обеспечение на стадии публичного использования. Стабильная версия программы, которая прошла тестирование.
Релокация — перевод сотрудника или бизнеса в другое место внутри страны или за границу.
Репа — репозиторий, хранилище данных. Например, код программы можно хранить в репозитории на GitHub.
Ридми — файл Readme, в котором содержится информация о программе.
Ругаться, например, линтер ругается — сообщения об ошибках в коде, работе сервиса и так далее.
С
Сабж — от английского Subject — тема, предмет. «По сабжу» — по теме обсуждения.
Свитчнуть, свичнуть — переключить. От английского switch.
Сетка — модульная сетка, используется для дизайна и верстки страниц.
Сеньор, синьор — от англ. Senior — старший разработчик.
Сорец (Сорцы) — от англ. Source. Исходный код.
Стек — изначально абстрактный тип данных. В разговорной речи используется для обозначения списка технологий, которые использует разработчик или компания. Пример: «Наш стек — HTML/CSS, JavaScript, React».
Софт — от англ. Software — программное обеспечение.
Софт-скиллы — от англ. Soft skills — знания и качества специалиста, прямо не связанные с профессиональной деятельностью. Примеры: коммуникабельность, проактивность.
Спринт — короткий промежуток времени (до 4 недель), в течение которого scrum-команда выполняет определенный объем работы.
Читайте также: Как джуну найти работу и где лучше начинать карьеру в IT: советы от Хекслета
Т
Таска — от англ. Task. Задание, задача.
Темплейт — от английского Template — шаблон.
Тестировщик — специалист по тестированию программного обеспечения.
Тимлид — от английского Team Lead — руководитель команды. Координатор группы программистов.
У
Убить — удалить что-то. Например, «убить профиль» означает удалить профиль.
Ф
Фидбек — от англ. Feedback — обратная связь.
Фиксить, пофиксить — от англ. Fix. Чинить, починить, исправить.
Фича — функция, возможность. От англ. Feature.
Фреймворк — от англ. Framework — каркас. Инструмент разработки, набор типовых шаблонных решений, упрощающих работу программиста. Примеры: Laravel, Bootstrap.
Фронтенд — от англ. Front-end — клиентская часть приложения.
Х
Хатэмээль, хатээмэль — HTML, язык гипертекстовой разметки.
Хардкодить — статически прописывать в коде данные, которые должны вычисляться динамически. Плохая практика, антипаттерн в программировании.
Хацкер, кулхацкер — ироничное название начинающего специалиста, который считает себя опытным программистом. От английского Hacker и Cool Hacker.
Хедер, хэдер — элемент структуры веб-страницы, находится в верхней части и содержит логотип, меню, служебную информацию.
Хотфикс — от англ. Hotfix. Срочное исправление критических ошибок, уязвимостей или недоработок в программе.
Ц
Цэмээс, цээмэс — от англ. CMS — Content Management System, система управления контентом.
Цээсэс — от англ. CSS — Cascading Style Sheets, каскадные таблицы стилей.
Ч
Чекать, чекнуть, прочекать — от англ. Check. Проверять, проверить.
Ю
Юзать — от английского To use — использовать.
Я
Ява — язык программирования Java.
Яваскрипт — язык программирования JavaScript.
ЯП — язык программирования.
Бесплатные курсы по программированию в Хекслете
- Освойте азы современных языков программирования
- Изучите работу с Git и командной строкой
- Выберите себе профессию или улучшите навыки
ML-разработка
Ещё в XVII веке известный математик Г.В. Лейбниц полагал, что любую мысль человека можно представить математическими формулами и элементарными символами. Идея наделить человеческим интеллектом неодушевлённые предметы прослеживалась в древней мифологии, в средневековой литературе. С развитием компьютерных технологий разработка искусственного интеллекта стала одним из самых активных направлений математической науки.
В середине XX века шла активная работа над обучением компьютеров. Долгое время это было прерогативой научных центров и институтов.
В последнее десятилетие технология вышла на новый уровень. Применять систему смогли разработчики всего мира не только в научных целях, но и для решения современных задач производства, продвижения, маркетинга, развлечения.
Видеозвонки в SberJazz
Общайтесь с друзьями и близкими везде, где есть Интернет
Попробовать сейчас
Что такое Machine Learning
Процессы машинного обучения называются также общим английским термином Machine Learning. Его суть — в передаче компьютерам определённых знаний и алгоритмов их анализа, на основе которых машина может:
- обучаться;
- выявлять закономерности;
- накапливать опыт для решения задач;
- строить прогнозы;
- собирать аналитические, статистические данные.
Технология позволяет обрабатывать данные и выполнять различные операции без инструкций программиста.
Итог Machine Learning — определённая модель, которая при правильно введённых параметрах способна решать задачи на уровне, близком к человеческому.
В отличие от образного человеческого представления, модели анализируют данные по конкретным признакам. Например, человек воспринимает образ перед ним в целом, он просто знает, что видит кошку, собаку, мышь или другое животное. Компьютер сделает вывод по длине хвоста, шерсти на ушах, размеру лап и так далее.
Потребность в машинном обучении
Machine Learning — это давно больше, чем виртуальный соперник по игре в шашки и шахматы. Например, когда компьютер проверяет тексты на грамматические ошибки, это воспринимается как нечто привычное. А стриминговые сервисы благодаря алгоритмам понимают предпочтения пользователей.
Чем больше в жизни человека удобства при решении задач, тем выше запрос на дальнейшую оптимизацию и цифровизацию. Для бизнеса создание моделей машинного обучения — способ автоматизировать производственную рутину и привлечь аудиторию. Разные типы алгоритмов позволяют, к примеру, сделать онлайн-игры ещё интереснее: система отследит поведение игрока и сформирует для него индивидуальное предложение.
Зачем и когда учить машины?
Способы машинного обучения делят на три общих типа:
- С учителем, или supervised learning. Цель — помочь компьютеру понять, почему процесс происходит именно так, выявить закономерности, последовательность действий в системе. Ответ известен заранее, поэтому алгоритм концентрируется на этапах его получения. Итоговая модель способна строить прогнозы.
- Без учителя, или unsupervised learning, — позволяет машине научиться самостоятельно выявлять закономерности при обработке массива загруженных данных. По выявленным закономерностям компьютер способен работать над задачами с новыми данными.
- C подкреплением, или reinforcement learning, — даёт машине возможность среди различных сценариев выбрать оптимальный. Иными словами, это метод проб и ошибок, при котором компьютер определяет последствия выбора и их связь с результатом.
Любой из способов приводит к разработке рабочего механизма, который оказывается в чём-то эффективнее человека:
- не устаёт, работает круглосуточно;
- совершает меньше ошибок;
- обрабатывает большие объёмы информации;
- оценивает данные непредвзято.
Это позволяет автоматизировать процессы, выявлять глубинные закономерности, оптимизировать работу сотрудников. Благодаря ML-разработке появилось огромное количество программ и сервисов, которые повышают качество жизни человека. Например, они помогают ориентироваться на местности, быстро находить любимые фильмы и музыку.
Сложные модели используются в промышленности, в сфере безопасности и различных крупных корпорациях. Благодаря разработкам происходит полная цифровая трансформация корпоративной культуры и делового взаимодействия в компании. К примеру, алгоритм может автоматически собирать, систематизировать, анализировать данные с датчиков оборудования на крупном производстве, а затем формировать отчёт.
Машинное обучение: принципы и задачи
В компьютер загружаются исходные данные (датасет) с метками и подробными разъяснениями. Программа анализирует все алгоритмы и закономерности, запоминает соотношение меток и сведений о них — таким образом формируется нейронная сеть. На основе полученной базы система может делать выводы, давать ответы, сопоставлять данные и делать выбор.
Чем больше действий совершит компьютер с базовой информацией, тем точнее будет анализ в последующем. ML предполагает непрерывное обучение.
Основа Machine Learning — работа с тремя составляющими:
- Данными как отправной точкой процесса. С них сеть начинает обучение и ими же непрерывно пополняет свою базу знаний.
- Признаками, которые служат метками, по которым модель может получать необходимые результаты и решать задачи.
- Алгоритмами, или методами, в соответствии с которыми компьютер совершает каждое действие. Они определяют форму модели, скорость её работы, точность ответов.
Machine Learning характеризуется тремя признаками:
- Инновационность. ML становится точкой роста и новым этапом развития в любой экономической сфере.
- Специфичность. Машинное обучение — сугубо IT-направление. Разработкой и внедрением занимаются люди, которые понимают языки программирования и умеют работать с IT-инструментами.
- Простота. ML позволяет создавать продукты, понятные любому пользователю вне зависимости от возраста, уровня знаний и умения работать с программами.
С помощью разработок Machine Learning бизнес решает задачи разного типа:
- Кластеризация — распределение данных на типы, группы и другие категории по заданным критериям.
- Классификация — ответ на вопрос по категории, например, есть ли на фотографии красные предметы.
- Уменьшение размерности — перевод от большего к меньшему, сжатие информации для дальнейшей визуализации.
- Регрессия — прогнозирование по различным признакам объектов в выборке, к примеру, прогноз стоимости объекта недвижимости через заданный период.
- Выявление аномалий — анализ процессов, выделение среди них нетипичных.
- Идентификация — выделение из общего массива данных только необходимых. Яркий пример — идентификация лица определённого человека среди всех распознанных системой.
- Прогнозирование — анализ существующих процессов и основанное на нём предсказание показателей через заданное время. Таким образом можно оценивать предположительную эффективность выбранной компанией стратегии развития.
Благодаря многозадачности ML становится универсальным инструментом в любой сфере — экономической, финансовой, производственной, социальной и других.
Инструменты ML
Применяемые в Machine Learning технологии связаны с тремя общими этапами разработки:
- система собирает и обрабатывает данные;
- ведётся обучение на основе полученных данных, формируется обученная модель;
- оценивается качество работы модели и развёртывается ПО для её использования.
Для разработки моделей используют готовые фреймворки и библиотеки на разных языках программирования. Они позволят быстро начать работу с собранным датасетом, для точной обработки данных необходимо отфильтровать ненужные.
Кроме того, понадобятся инструменты для визуализации на разных этапах, она поможет выделить важные признаки, аномалии, линейные закономерности. Готовая модель должна пройти тестирование.
ML-разработка становится удобнее и доступнее, если все необходимые инструменты собраны на одной платформе. Продукт ML Space позволяет работать над моделями командой в едином пространстве.
Среди преимуществ решения:
- ML-разработка полного цикла на высокопроизводительной инфраструктуре с использованием мощностей суперкомпьютеров Christofari и Christofari Neo;
- командная работа на каждом этапе;
- более 1700 GPU для распределённого обучения и артефактов на маркетплейсах DataHub и AI Services;
- удобный интерфейс, множество встроенных популярных библиотек, утилит и других привычных инструментов с модулем Environments;
- Data Catalog для работы с ML-артефактами;
- инструмент для тестирования и развёртывания Deployments;
- сервисы автоматического построения моделей, обработки данных AutoML и Pipelines;
- доступ при разработке к предобученным моделям, датасетам и контейнерам в модуле DataHub.
Платформа учитывает специфику российского рынка, в том числе законодательство о защите персональных данных.
Платформа для совместной ML-разработки полного цикла на базе суперкомпьютеров Christofari и Christofari Neo
Практическое применение ML-технологий
Робототехника
Функциональность физических роботов может ограничиваться простыми действиями, основанными на контроллерах, датчиках, сенсорах. Самые простые образцы работают по строго заданным координатам, но этого не всегда достаточно. Иногда необходимо, чтобы робот мог решать более сложные задачи по выученным алгоритмам.
Machine Learning позволяет роботам:
- видеть и распознавать речь;
- определять заданные объекты;
- отслеживать перемещающиеся объекты;
- сегментировать содержимое видимой картинки;
- оценивать расстояния, обходить препятствия на пути;
- ориентироваться в пространстве;
- захватывать объекты, манипулировать ими;
Для реализации различных функций необходим большой объём вычислительного пространства и высокопроизводительные GPU.
Маркетинг
Алгоритмы разного типа позволяют маркетологам обрабатывать большие массивы данных, превращать их в знания, на основе которых строятся прогнозы и стратегии развития. Machine Learning даёт возможность сегментировать целевую аудиторию, прогнозировать поведение клиентов, корректировать действия в реальном времени.
Безопасность
Интеллектуальный анализ записей с камер видеонаблюдения помогает в режиме реального времени отслеживать различные физические угрозы. Крупные компании используют распознавание лиц сотрудников вместо традиционных пропусков, а системы умного города позволяют быстро искать преступников.
Модели эффективны в кибербезопасности. Компьютер обучается на базе предсказуемых действий, которые выполняются при определённом процессе в сети. Например, параметры работы сотрудников с корпоративной почтой будут иметь стабильный характер — одинаковое время открытия и закрытия, фиксированные действия, привязка к устройствам и локации.
Любые отклонения воспринимаются как угроза, о которой система проинформирует пользователя.
Финансовый сектор и страхование
Один из ярких примеров применения методов Machine Learning в банковском секторе — автоматическая оценка кредитного потенциала заявителя. В страховании интеллектуальный анализ позволяет оценить степень страховых рисков по направлениям. На рынке ценных бумаг разработки ML позволяют прогнозировать рост или падение акций по результатам анализа финансовых новостей и текущих торгов.
Общественное питание
Насущный вопрос сферы общепита — контроль производственных процессов, обслуживания клиентов. Компьютерное зрение как область Machine Learning способно анализировать окружающее пространство, распознавать объекты, действия, перемещения.
Система сможет определить, есть ли на сотрудниках перчатки, головные уборы, верно ли упакован заказ. Это позволит выявить слабые места, провести дополнительное обучение, продумать новые маркетинговые ходы.
Медицина
Интеллектуальный анализ способен упростить работу врача. На основе оцифрованных результатов различных обследований и анализов модель сможет дать предварительную оценку состояния здоровья пациента, определит вектор дальнейшего поиска проблем.
Добыча полезных ископаемых
Машинное зрение упрощает процессы в горнодобывающей промышленности. Так, на стадии дробления руды до более мелких фракций система может отслеживать в идущих по конвейеру обломках слишком крупные либо инородные предметы. Она подаст сигнал оператору или вовсе остановит процесс, чтобы не дать элементам неподходящего размера и состава застрять в оборудовании. Аналогичным образом отслеживается целостность конвейерных лент.
ML-модели — новый этап цифровизации бизнеса и жизни человека. Работа с Big Data стала проще, а доступ к технологии получили новые пользователи. Единая платформа для ML-разработки ML Space позволяет создавать собственные персонализированные модели для внедрения в бизнес-процессы.