Publications

Preprints

LLM-jp: Akiko Aizawa, Eiji Aramaki, Bowen Chen, Fei Cheng, Hiroyuki Deguchi, Rintaro Enomoto, Kazuki Fujii, Kensuke Fukumoto, Takuya Fukushima, Namgi Han, Yuto Harada, Chikara Hashimoto, Tatsuya Hiraoka, Shohei Hisada, Sosuke Hosokawa, Lu Jie, Keisuke Kamata, Teruhito Kanazawa, Hiroki Kanezashi, Hiroshi Kataoka, Satoru Katsumata, Daisuke Kawahara, Seiya Kawano, Atsushi Keyaki, Keisuke Kiryu, Hirokazu Kiyomaru, Takashi Kodama, Takahiro Kubo, Yohei Kuga, Ryoma Kumon, Shuhei Kurita, Sadao Kurohashi, Conglong Li, Taiki Maekawa, Hiroshi Matsuda, Yusuke Miyao, Kentaro Mizuki, Sakae Mizuki, Yugo Murawaki, Ryo Nakamura, Taishi Nakamura, Kouta Nakayama, Tomoka Nakazato, Takuro Niitsuma, Jiro Nishitoba, Yusuke Oda, Hayato Ogawa, Takumi Okamoto, Naoaki Okazaki, Yohei Oseki, Shintaro Ozaki, Koki Ryu, Rafal Rzepka, Keisuke Sakaguchi, Shota Sasaki, Satoshi Sekine, Kohei Suda, Saku Sugawara, Issa Sugiura, Hiroaki Sugiyama, Hisami Suzuki, Jun Suzuki, Toyotaro Suzumura, Kensuke Tachibana, Yu Takagi, Kyosuke Takami, Koichi Takeda, Masashi Takeshita, Masahiro Tanaka, Kenjiro Taura, Arseny Tolmachev, Nobuhiro Ueda, Zhen Wan, Shuntaro Yada, Sakiko Yahata, Yuya Yamamoto, Yusuke Yamauchi, Hitomi Yanaka, Rio Yokota, and Koichiro Yoshino.
LLM-jp: A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs.
arXiv:2407.03963, July, 2024.
[arXiv]
Yugo Murawaki.
On the Definition of Japanese Word.
arXiv:1906.09719, June, 2019.
[arXiv]

初 arXiv。

Journal Papers (Refereed)

Hirotaka Kameko, Yugo Murawaki, Suguru Matsuyoshi, and Shisuke Mori.
Japanese Event Factuality Analysis in the Era of BERT.
IEEE Access. Vol. 11, pp. 93286-93292, 2023.
[paper]
岡久太郎, 田中リベカ, 児玉貴志, Yin Jou Huang, 村脇有吾, 黒橋禎夫.
コツを引き出す対話設定におけるオンライン料理インタビュー対話コーパスの構築.
自然言語処理, Vol 30, No. 2, pp. 773-799, 2023.(technical paper).
[J-STAGE]

査読付き技術資料。
田中佑, 村脇有吾, 河原大輔, 黒橋禎夫.
日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの構築.
自然言語処理, Vol 28, No. 4, pp. 995-1033, 2021.
[J-STAGE]
亀甲博貴, 松吉俊, John Richardson, 牛久敦, 笹田鉄郎, 村脇有吾, 鶴岡慶雅, 森信介.
将棋解説文への固有表現・モダリティ情報アノテーション.
自然言語処理, Vol 28, No. 3, pp. 847-873, 2021.
[J-STAGE]
岸本裕大, 村脇有吾, 河原大輔, 黒橋禎夫.
日本語談話関係解析: タスク設計・談話標識の自動認識・コーパスアノテーション.
自然言語処理, Vol 27, No. 4, pp. 889-931, 2020.
[J-STAGE]
Yugo Murawaki.
Bayesian Learning of Latent Representations of Language Structures.
Computational Linguistics 45(2), pp. 199-228, 2019.
[abstract] [full text] [code]

IJCNLP 2017 の内容を拡大したもの。Submission received: 15 July 2018; Revised version received: 28 December 2018; Accepted for publication: 8 February 2019.
浅原正幸, 金山博, 宮尾祐介, 田中貴秋, 大村舞, 村脇有吾, 松本裕治.
Universal Dependencies日本語コーパス.
自然言語処理, Vol 26, No. 1, pp. 3-36, 2019. (言語処理学会30周年記念論文賞受賞)
[J-STAGE]

http://www.anlp.jp/abst/vol26/no1.html
Yugo Murawaki and Kenji Yamauchi.
A Statistical Model for the Joint Inference of Vertical Stability and Horizontal Diffusibility of Typological Features.
Journal of Language Evolution 3(1), pp. 13-25, 2018.
[article] [accepted manuscript] [supplementary material] [code]

COLING2016 のネタを大拡張したもの。The OUP allows the authors to make their accepted manuscript available on their non-commercial homepage or blog after publication. No longer paywalled.
Yugo Murawaki.
Spatial Structure of Evolutionary Models of Dialects in Contact.
PLOS ONE 10(7): e0134335 (15 pages), 2015.
[full text] [code]

YANS 2014 の内容をそのままジャーナル化したもの。
村脇有吾.
階層的複数ラベル文書分類におけるラベル間依存の利用.
自然言語処理, Vol.21, No.1, pp. 41-60, 2014.
[J-STAGE]

IJCNLP2014 のネタをジャーナル化したもの。期間終了後はデータを破棄する契約なので再現実験はできない。論文では所属を九大にしたけど、京大在籍時の成果。一応初版投稿時点では京大に在籍していた。
村脇有吾, 黒橋禎夫.
形態論的制約を用いたオンライン未知語獲得.
自然言語処理, Vol.17, No.1, pp. 55-75, 2010.
[J-STAGE] [code]

EMNLP 2008 のネタをジャーナル化したもの。

International Conferences (Refereed)

Yoshiki Takenami, Yin Jou Huang, Yugo Murawaki, and Chenhui Chu.
How Does Cognitive Bias Affect Large Language Models? A Case Study on the Anchoring Effect in Price Negotiation Simulations.
In Proceedings of EMNLP 2025 Findings, pp. ???-???, Suzhou, China, Nov 2025. (to appear). (findings)
Jivnesh Sandhan, Fei Cheng, Tushar Sandhan, and Yugo Murawaki.
From Disney-World to Reality: A Context-Dependent Testbed for Personality Assessment of Large Language Models.
In Proceedings of EMNLP 2025 Findings, pp. ???-???, Suzhou, China, Nov 2025. (to appear). (findings)
Ruiyi Yan and Yugo Murawaki.
Addressing Tokenization Inconsistency in Steganography and Watermarking Based on Large Language Models.
In Proceedings of EMNLP 2025 Main, pp. ???-???, Suzhou, China, Nov 2025. (to appear).
Chengzhi Zhong, Qianying Liu, Fei Cheng, Junfeng Jiang, Zhen Wan, Chenhui Chu, Yugo Murawaki, and Sadao Kurohashi.
What Language Do Non-English-Centric Large Language Models Think in?
Findings of the Association for Computational Linguistics: ACL 2025, pp. 26333-26346, Vienna, Austria, July, 2025.
[paper] [arXiv]
Shiho Matta, Yin Jou Huang, Fei Cheng, Hirokazu Kiyomaru and Yugo Murawaki.
Optimizing Cost-Efficiency with LLM-Generated Training Data for Conversational Semantic Frame Analysis.
In Proceedings of the 9th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature (LaTeCH-CLfL 2025), pp. 238-251, Albuquerque, New Mexico, U.S., May 2025. (workshop).
[paper] [earlier arXiv version]
Taishi Chika, Taro Okahisa, Takashi Kodama, Yin Jou Huang, Yugo Murawaki and Sadao Kurohashi.
Domain Transferable Semantic Frames for Technical Interview Dialogues.
In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp. 5299-5308, Torino, Italy, May 2024.
[paper] [dataset]
Norizo Sakaguchi, Yugo Murawaki, Chenhui Chu and Sadao Kurohashi.
Identifying Source Language Expressions for Pre-editing in Machine Translation.
In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp. 8605-8616, Torino, Italy, May 2024.
[paper] [slides]

oral. 卒業した学生に代わって私が発表。
Yugo Murawaki.
Principal Component Analysis as a Sanity Check for Bayesian Phylolinguistic Reconstruction.
In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp. 12999-13013, Torino, Italy, May 2024.
[paper] [arXiv] [poster] [pre-recorded video] [code]

poster.
Nobuhiro Ueda, Kazumasa Omura, Takashi Kodama, Hirokazu Kiyomaru, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
KWJA: A Unified Japanese Analyzer Based on Foundation Models.
In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics: System Demonstrations (ACL 2023), pp. 538-548, Toronto, Canada, July, 2023. (system demonstration).
[paper] [code]

NL研の発表がベース。
Jumon Nozaki and Yugo Murawaki.
Addressing Segmentation Ambiguity in Neural Linguistic Steganography.
In Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (AACL-IJCNLP 2022), pp. 109-116, online, November, 2022. (short paper).
[paper] [arXiv] [author manuscript] [code]

台湾で開催されるはずだった会議。ポスター発表。
Masato Umakoshi, Yugo Murawaki and Sadao Kurohashi.
Japanese Zero Anaphora Resolution Can Benefit from Parallel Texts Through Neural Transfer Learning.
In Findings of the Association for Computational Linguistics: EMNLP 2021, pp. 1920-1934, Punta Cana, Dominican Republic/online, November, 2021. (findings).
[paper]

video.
Honai Ueoka, Yugo Murawaki and Sadao Kurohashi.
Frustratingly Easy Edit-based Linguistic Steganography with a Masked Language Model.
In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2021), pp. 5486-5492, online, June 2021. (short paper).
[paper] [video] [code] [arXiv]

Mexico City -> online.
Oleksandr Harust, Yugo Murawaki and Sadao Kurohashi.
Native-like Expression Identification by Contrasting Native and Proficient Second Language Speakers.
In Proceedings of COLING 2020, the 28th International Conference on Computational Linguistics: Technical Papers, pp. 5843-5854, online, December 2020.
[paper] [video]

Supposed to be held in Barcelona. Oral.
Akiko Aizawa, Frederic Bergeron, Junjie Chen, Fei Cheng, Katsuhiko Hayashi, Kentaro Inui, Hiroyoshi Ito, Daisuke Kawahara, Masaru Kitsuregawa, Hirokazu Kiyomaru, Masaki Kobayashi, Takashi Kodama, Sadao Kurohashi, Qianying Liu, Masaki Matsubara, Yusuke Miyao, Atsuyuki Morishima, Yugo Murawaki, Kazumasa Omura, Haiyue Song, Eiichiro Sumita, Shinji Suzuki, Ribeka Tanaka, Yu Tanaka, Masashi Toyoda, Nobuhiro Ueda, Honai Ueoka, Masao Utiyama, and Ying Zhong.
A System for Worldwide COVID-19 Information Aggregation.
Workshop on NLP for COVID-19 (Part 2) at EMNLP 2020, online, November 2020. (workshop)
[paper] [OpenReview] [ACL2020 workshop poster] [ACL2020 workshop video] [website]
Yugo Murawaki.
Latent Geographical Factors for Analyzing the Evolution of Dialects in Contact.
In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), pp. 959-976, online, November 2020.
[paper] [slides] [code]

Supposed to be held in Punta Cana. Gather Session (=~ poster presentation though I submitted a pre-recorded talk).
Yu Tanaka, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
Building a Japanese Typo Dataset from Wikipedia's Revision History.
In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2020 SRW), pp. 230-236, online, July 2020. (student research workshop).
[paper] [dataset]

The physical conference in Seattle was cancelled.
Yudai Kishimoto, Yugo Murawaki and Sadao Kurohashi.
Adapting BERT to Implicit Discourse Relation Classification with a Focus on Discourse Connectives.
In Proceedings of the 12th Edition of the Language Resources and Evaluation Conference (LREC 2020), pp. 1152-1158, (meeting cancelled), May 2020.
[paper]

supposed to be an oral presentation, but the conference was cancelled. Marseille, France. No online meeting.
Jun Saito, Yugo Murawaki and Sadao Kurohashi.
Minimally Supervised Learning of Affective Events Using Discourse Relations.
In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP 2019), pp. 5762-5769, Hong Kong, November 2019. (short paper).
[paper] [arXiv]

oral.
Hirokazu Kiyomaru, Kazumasa Omura, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
Diversity-aware Event Prediction based on a Conditional Variational Autoencoder with Reconstruction.
In Proceedings of the First Workshop on Commonsense Inference in Natural Language Processing (COIN), pp. 113-122, Hong Kong, November 2019. (workshop).
[paper] [code]

An EMNLP-IJCNLP 2019 workshop. Acceptance ratio: 16 / 22 (source: slides of the opening talk).
Suzushi Tomori, Yugo Murawaki and Shinsuke Mori.
A Hybrid Generative/Discriminative Model for Rapid Prototyping of Domain-Specific Named Entity Recognition.
In 20th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2019), 16 pages, La Rochelle, France, April 2019.
[paper] [EasyChair preprint]

Selected for the main proceedings volume of Springer LNCS. Poster.
Yugo Murawaki.
Analyzing Correlated Evolution of Multiple Features Using Latent Representations.
In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP2018), pp. 4371-4382, Brussels, Belgium, November 2018.
[paper] [supplementary material] [slides] [code]

oral presentation.
Yudai Kishimoto, Yugo Murawaki and Sadao Kurohashi.
A Knowledge-Augmented Neural Network Model for Implicit Discourse Relation Classification.
In Proceedings of COLING 2018, the 27th International Conference on Computational Linguistics: Technical Papers, pp. 584-595, Santa Fe, New Mexico, U.S., August 2018. (Area Chair Favorite).
[paper]

Area Chair Favorite (including Best Papers): (34 + 8) / 331 = 0.127
Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations.
In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC 2018), pp. 4044-4048, Miyazaki, Japan, May 2018.
[paper]

poster.
Suguru Matsuyoshi, Hirotaka Kameko, Yugo Murawaki and Shinsuke Mori.
Annotating Modality Expressions and Event Factuality for a Japanese Chess Commentary Corpus.
In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC 2018), pp. 2475-2481, Miyazaki, Japan, May 2018.
[paper] [corpus]

poster.
Masayuki Asahara, Hiroshi Kanayama, Takaaki Tanaka, Yusuke Miyao, Sumire Uematsu, Shinsuke Mori, Yuji Matsumoto, Mai Omura and Yugo Murawaki.
Universal Dependencies Version 2 for Japanese.
In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC 2018), pp. 1824-1831, Miyazaki, Japan, May 2018.
[paper]

Oral presentation.
Yugo Murawaki.
Diachrony-aware Induction of Binary Latent Representations from Typological Features.
In Proceedings of the 8th International Joint Conference on Natural Language Processing (IJCNLP 2017), pp. 451-461, Taipei, Taiwan, November 2017.
[paper] [supplementary material] [slides] [code]

Oral presentation.
Kenji Yamauchi and Yugo Murawaki.
Contrasting Vertical and Horizontal Transmission of Typological Features.
In Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers. pp. 836-846, Osaka, Japan. December 2016.
[paper] [errata] [code]

研究費が年に1回しか国際会議に行けないほど少額で、そのカードを NAACL2016 で使ってしまっていたが、国内開催だったから行けた。
Yugo Murawaki.
Statistical Modeling of Creole Genesis.
In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2016), pp. 1329-1339, San Diego, California, June 2016.
[paper] [slides] [code]

NLP2016 で話したのと同じ内容。NLP2016 の発表のちょうど 1 週間前に採択通知が来た。
Yugo Murawaki and Shinsuke Mori.
Wikification for Scriptio Continua.
In Proceedings of the 10th Edition of the Language Resources and Evaluation Conference (LREC 2016), pp. 1346-1351, Portorož, Slovenia, May 2016.
[paper] [errata] [poster] [corpora]

とりあえずコーパス作成だけで論文にした。久しぶりの LREC。
Yugo Murawaki.
Continuous Space Representations of Linguistic Typology and their Application to Phylogenetic Inference.
In Proceedings of the 2015 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2015), pp. 324-334, Denver, Colorado, June 2015.
[paper] [errata] [poster] [related code]

NLP2015 で話したのと同じ内容。
Yugo Murawaki.
Global Model for Hierarchical Multi-Label Text Classification.
In Proceedings of the Sixth International Joint Conference on Natural Language Processing (IJCNLP 2013), pp. 46-54, Nagoya, Japan, October 2013.
[paper] [slides]

Accept-Regular。なぜか単著。九大に移って2週間後ぐらいに会議があったので、論文では京大所属になっている。
Yugo Murawaki and Sadao Kurohashi.
Semi-Supervised Noun Compound Analysis with Edge and Span Features.
In Proceedings of COLING 2012: Technical Papers, pp. 1915-1931, Mumbai, India, December 2012.
[paper] [slides]

Accept-Waiting-Long から Accept-Reserve へ。どうなることかと思ったが発表できた。ひどいめにあった。PPspliT を使ってスライドをアニメーションごとに分割してから PDF を作成。ページ番号が元ファイルとずれるのを何とかしたい。
Yugo Murawaki and Sadao Kurohashi.
Non-parametric Bayesian Segmentation of Japanese Noun Phrases.
In Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing (EMNLP2011), pp. 605-615, Edinburgh, UK, July 2011.
[paper] [errata] [slides] [related code]

oral。気をつけたつもりがやっぱり誤植がある。
Yugo Murawaki and Sadao Kurohashi.
Semantic Classification of Automatically Acquired Nouns using Lexico-Syntactic Clues.
In Proceedings of COLING 2010: Posters, pp. 876-884, Beijing, China, August 2010.
[paper] [poster] [related code]

またしてもポスター。これもやっぱり問題設定問題。昔の人の設計は微妙だったんじゃないかと今となっては思うけど、既にみんながそれに依存してしまっているので、とりあえずそれにあわせてみましょうという話。
Yugo Murawaki and Sadao Kurohashi.
Online Japanese Unknown Morpheme Detection using Orthographic Variation.
In Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10), pp. 832-839, Valletta, Malta, May 2010.
[paper] [related code]

日本語を扱っているとこういう問題も発生しますという紹介。解法はものすごくいいかげん。
Yugo Murawaki and Sadao Kurohashi.
Online Acquisition of Japanese Unknown Morphemes using Morphological Constraints.
In Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing (EMNLP2008), pp. 429-437, Honolulu, Hawaiʻi, October 2008.
[paper] [errata] [poster] [related code]

NLP2008 での発表がベースだが、NLP2008 で混乱していた部分を整理したつもり。プログラムは完全に書換えたけど、論文にするとあまり差が出ない。日本語特有の話を説明するのは難儀。

Domestic Conferences and Workshops (with Proceedings)

樽谷洋希, Yin Jou Huang, 松田思鵬, 村脇有吾, 黒橋禎夫, 近大志, 岡久太郎.
技能者インタビュー対話におけるコツ発話の表出に至った発話列の特徴の分析.
言語処理学会第31回年次大会, pp. 4182-4187, 長崎/online, 2025.3.
[paper]

著者順はミス。
Shiho Matta, Yin Jou Huang, Fei Cheng, Hirokazu Kiyomaru and Yugo Murawaki.
Exploring LLM-based Data Synthesis Strategies for Conversational Semantic Frame Analysis.
言語処理学会第31回年次大会, pp. 3575-3580, 長崎/online, 2025.3.
[paper]
山本有起, Arjav Singh, Yin Jou Huang, Chenhui Chu, 村脇有吾.
心理測定テストに関するLLMのメタ知識の検証.
言語処理学会第31回年次大会, pp. 3044-3049, 長崎/online, 2025.3.
[paper]
Yikun Sun, Sakiko Yahata, Fei Cheng, Yugo Murawaki, Chenhui Chu and Sadao Kurohashi.
Constructing Open-source Large Language Model Evaluator for Japanese.
言語処理学会第31回年次大会, pp. 2861-2866, 長崎/online, 2025.3.
[paper]
Chengzi Zhong, Fei Cheng, Qianying Liu, Jufeng Jiang, Zhen Wan, Chenhui Chu, Yugo Murawaki and Sadao Kurohashi.
What Language Do Japanese-specialized Large Language Models Think in?
言語処理学会第31回年次大会, pp. 2618-2623, 長崎/online, 2025.3.
[paper]
Ruiyi Yan and Yugo Murawaki.
Low-Overhead Disambiguation for Generative Linguistic Steganography via Tokenization Consistency.
言語処理学会第31回年次大会, pp. 2053-2058, 長崎/online, 2025.3.
[paper]
武並佳輝, Yin Jou Huang, 村脇有吾 and Chenhui Chu.
LLMによる価格交渉シミュレーションにおけるアンカリング効果の検証.
言語処理学会第31回年次大会, pp. 920-925, 長崎/online, 2025.3.
[paper]
Dorjnyam Tumur-Ochir, Yugo Murawaki, Fei Cheng and Chenhui Chu.
Evaluating Large Language Models in Mongolian.
言語処理学会第31回年次大会, pp. 368-373, 長崎/online, 2025.3.
[paper]
近大志, 岡久太郎, Yin Jou Huang, 樽谷洋希, 松田思鵬, 村脇有吾, 黒橋禎夫.
技能者インタビュー対話コーパス (EIDC) v.2.0: コツ発話の同定に向けた相互行為アノテーション.
言語処理学会第31回年次大会, pp. 345-350, 長崎/online, 2025.3.
[paper]
村脇有吾.
文字言語モデルからの単語言語モデルの教師なし合成.
情報処理学会第260回自然言語処理研究会, 14 pages, 金沢/online, 2024.6. (優秀研究賞受賞).
[author manuscript] [IPSJ]

京大開催。
Namgi Han, 植田暢大, 大嶽匡俊, 勝又智, 鎌田啓輔, 清丸寛一, 児玉貴志, 菅原朔, Bowen Chen, 松田寛, 宮尾祐介, 村脇有吾, 劉弘毅.
llm-jp-eval: 日本語大規模言語モデルの自動評価ツール.
言語処理学会第30回年次大会, pp. 2085-2089, 神戸/online, 2024.3.
[paper]
清水周一郎, Yin Jou Huang, 村脇有吾, Chenhui Chu.
対話の齟齬と介入による解消: LLM を用いた検討.
言語処理学会第30回年次大会, pp. 1492-1497, 神戸/online, 2024.3.
[paper]
渡邉幸暉, 村脇有吾, 黒橋禎夫.
ニューラル分類器の予測の解釈に基づく集団に特徴的なテキスト表現の抽出:アメリカ人を例に.
言語処理学会第29回年次大会, pp. 1371-1376, 宜野湾/online, 2023.3. (第1著者 (学生) が若手奨励賞受賞)
[paper]
児玉貴志, 植田暢大, 大村和正, 清丸寛一, 村脇有吾, 河原大輔, 黒橋禎夫.
テキスト生成モデルによる日本語形態素解析.
言語処理学会第29回年次大会, pp. 339-344, 宜野湾/online, 2023.3.
[paper]
坂口典三, 村脇有吾, Chenhui Chu, 黒橋禎夫.
ニューラル分類器の予測の解釈に基づく翻訳が難しい表現の検出.
言語処理学会第29回年次大会, pp. 21-26, 宜野湾/online, 2023.3.
[paper]
植田暢大, 大村和正, 児玉貴志, 清丸寛一, 村脇有吾, 河原大輔, 黒橋禎夫.
KWJA: 汎用言語モデルに基づく日本語解析器.
情報処理学会第253回自然言語処理研究会, pp. 1-14, 京都/online, 2022.9. (優秀研究賞受賞).
[author manuscript] [IPSJ]

京大開催。
馬越雅人, 村脇有吾, 黒橋禎夫.
翻訳言語モデルを中間タスクとするゼロ照応解析.
言語処理学会第28回年次大会, pp. 1936-1941, 浜松/online, 2022.3.
[author manuscript] [paper]

現地には行かなかった。
和田有輝也, 村脇有吾, 黒橋禎夫.
セミマルコフCRF自己符号化器による教師なし単語分割.
言語処理学会第28回年次大会, pp. 806-810, 浜松/online, 2022.3.
[author manuscript] [paper]
田中佑, 村脇有吾, 河原大輔, 黒橋禎夫.
日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良.
言語処理学会第27回年次大会, pp. 1540-1545, 北九州/online, 2021.3. (言語資源賞、委員特別賞受賞).
[author manuscript] [paper] [resources]
尾崎立一, 橋本力, 村脇有吾, 黒橋禎夫, 颯々野学.
Wikipediaからの意外な恩恵事例の抽出.
言語処理学会第27回年次大会, pp. 471-475, 北九州/online, 2021.3.
[author manuscript] [paper]
田中佑, 村脇有吾, 河原大輔, 黒橋禎夫.
Wikipediaの修正履歴を用いた日本語入力誤りデータセットの構築.
言語処理学会第26回年次大会, pp. 1543-1546, online, 2020.3.
[author manuscript] [paper]

茨城大開催からオンライン開催に変更。
友利涼, 村脇有吾, 松吉俊, 亀甲博貴, 森信介.
モダリティ表現認識・事象の事実性解析の同時学習.
情報処理学会第241回自然言語処理研究会, pp. 1-8, 小樽, 2019.8.
[IPSJ]
清丸寛一, 大村和正, 村脇有吾, 河原大輔, 黒橋禎夫.
Conditional VAEに基づく多様性を考慮したイベント予測.
言語処理学会第25回年次大会, pp. 1531-1534, 名古屋, 2019.3.
[author manuscript] [paper]
亀甲博貴, 松吉俊, 村脇有吾, 森信介.
モンテカルロシミュレーションによる認識的モダリティ表現のグラウンディング手法の検討.
言語処理学会第25回年次大会, pp. 731-734, 名古屋, 2019.3.
[author manuscript] [paper] [slides]
中川裕貴, 村脇有吾, 河原大輔, 黒橋禎夫.
クラウドソーシングによる大喜利の面白さの構成要素の分析.
言語処理学会第25回年次大会, pp. 233-236, 名古屋, 2019.3. (第1著者 (学生) が若手奨励賞受賞)
[author manuscript] [paper]
岸本裕大, 村脇有吾, 黒橋禎夫.
一般常識を用いた非明示的な談話関係解析.
言語処理学会第24回年次大会, pp. 276-279, 岡山, 2018.3.
[author manuscript] [paper]
時武孝介, 村脇有吾, 黒橋禎夫.
ガウス埋め込みに基づく単語の意味の史的変化分析.
言語処理学会第24回年次大会, pp. 61-64, 岡山, 2018.3.
[paper]
村脇有吾.
特徴間の依存関係を考慮した基本語順の史的変化の分析.
言語処理学会第24回年次大会, pp. 57-60, 岡山, 2018.3.
[author manuscript] [paper]
松吉俊, 村脇有吾, 亀甲博貴, 森信介.
将棋解説文へのモダリティ情報アノテーション.
情報処理学会第233回自然言語処理研究発表会, pp. 1-9, 宮古島, 2017.10.
[IPSJ]

NL研。自分は不参加。
村脇有吾.
言語類型論的特徴からの潜在的2値パラメータの獲得.
言語処理学会第23回年次大会, pp. 903-906, つくば, 2017.3.
[author manuscript] [paper] [slides]
岸本裕大, 澤田晋之介, 村脇有吾, 河原大輔, 黒橋禎夫.
クラウドソーシングを用いた談話関係アノテーションの改良.
言語処理学会第23回年次大会, pp. 819-822, つくば, 2017.3.
[author manuscript] [paper]

クラウドソーシング以前にタグ付け仕様に検討の余地がある。
村脇有吾.
クレオール形成に対する混合モデル.
言語処理学会第22回年次大会, pp. 853-856, 仙台, 2016.3.
[author manuscript] [paper] [errata] [slides]

申し込み後発表までに NAACL の採択通知があった。
村脇有吾.
言語類型の連続空間表現とその系統推定への応用.
言語処理学会第21回年次大会, pp. 337-340, 京都, 2015.3.
[author manuscript] [paper] [slides]

東工大の高村先生、甲南大の永田先生と一緒に企画したテーマセッション「言語探求のための数理的アプローチ」で発表。
村脇有吾.
方言群の語彙は系統樹をなすか.
NLP若手の会 (YANS) 第9回シンポジウム, 9 pages, 三浦, 2014.9. (奨励賞受賞)
[author manuscript] [paper] [slides] [related code]

若手の会のサイトに上げたスライドからは画像の大半を削除しています。原著作者の許可をとるように求められたので。
村脇有吾, 粟飯原俊介, 原田泰佑, 長尾真, 田中久美子.
意味的逆引き辞書『真言』におけるスコア付け.
言語処理学会第20回年次大会, pp. 396-399, 札幌, 2014.3.
[paper] [errata] [slides]

前回大会ではお客さんとして聞いていた話。著者数が過去最高。
村脇有吾.
フレーズベースTF-IDF: 名詞句解析の応用.
情報処理学会第214回自然言語処理研究会, pp. 1-8, 屋久島, 2013.11.
[IPSJ] [slides]

完全電子化の影響で、ページ数が常に1からはじまるらしい。
村脇有吾, 黒橋禎夫.
名詞句の内部構造を考慮したキーワードのスコア付け.
言語処理学会第19回年次大会, pp. 516-519, 名古屋, 2013.3. (若手奨励賞受賞)
[paper] [slides]

PPspliT が分割前のページ番号を維持するようになって便利に。
黒橋禎夫, 進義治, 柴田知秀, 村脇有吾, 河原大輔.
日本語語彙知識の統一的・整合的管理のデザイン.
言語処理学会第19回年次大会, pp. 26-29, 名古屋, 2013.3.
[paper]

はじめての第4著者。というかボスが第1著者。
村脇有吾, 岸本侑也, 黒橋禎夫.
ベイズ学習によるカタカナ複合語の分割.
言語処理学会第18回年次大会, pp. 447-450, 広島, 2012.3.
[paper] [errata] [slides]

著者が3人になったのははじめて。見切り発車で悲惨な目にあった。
柴田知秀, 村脇有吾, 黒橋禎夫, 河原大輔.
実テキスト解析をささえる語彙知識の自動獲得.
言語処理学会第18回年次大会, pp. 81-84, 広島, 2012.3.
[paper]

はじめての第2著者。
村脇有吾, 黒橋禎夫.
日本語未知語のテキストからの自動獲得.
電子情報通信学会言語理解とコミュニケーション研究会 (NLC)(第1回テキストマイニング・シンポジウム), 東京, 2011.7.
[author manuscript] [slides]

未知語獲得の一連の研究をまとめてみた。
村脇有吾, 黒橋禎夫.
混成型別サンプリングを用いた名詞句分割.
言語処理学会第17回年次大会, pp. 564-567, 豊橋, 2011.3.
[paper] [slides]

タイトルを見ると、何かとってもニッチなところを攻めている印象を与えますが、実際そうだから仕方がありません。人間の辞書登録から漏れた語彙をどうにかしましょうという話の一環です。アノテーションがないなら、教師なし単語分割をやればいいじゃないかという話になりますが、日本語の複雑な品詞をどうにもモデルに組み込みにくいという問題があります。品詞を考えず分割に専念するとしても、実際にはなかなか人間が思っているような分割を行ってくれません。そもそも変改しない単語が連続するというモデルの仮定がなりたっていません。変化しない語幹と変化する語尾をくっつけて一つの形態素とみなすというのが人間の方針なので。そこで、今回はこの仮定がなりたっている名詞の連続に専念しています。
村脇有吾, 黒橋禎夫.
テキストから自動獲得した名詞の分類.
言語処理学会第16回年次大会, pp. 716-719, 東京, 2010.3.
[paper] [errata] [slides]

COLING2010 を参照してください。やっぱり PowerPoint を PDF 化すると数式が壊れます。誰か直しかたを知っていたら教えてください。
村脇有吾, 黒橋禎夫.
オンライン語彙獲得を用いたリアルタイムウェブの言語処理.
言語処理学会第16回年次大会, pp. 551-554, 東京, 2010.3.
[paper] [poster]

単なるおもちゃですが、こういうこともできますよということで。Twitter に手を出したのは早い方だと思います。
村脇有吾, 黒橋禎夫.
語彙獲得のための過分割未知語の検出.
言語処理学会第15回年次大会, pp. 324-327, 鳥取, 2009.3.
[paper] [errata] [slides]

草稿は、読み返すと誤字やら何やらで問題だらけでした。すみません。スライド側は修正版をもとに作っています。おまけスライドの数式の表示がバグっています。

今回の発表の範囲ではありませんが、現状の未知語獲得システムは、獲得される未知語については、蓄積された用例を5-10個程度比較した時点で獲得を決めます。大抵の場合、この程度の数の用例で曖昧性解消に充分であり、逆に無闇にデータを増やすとかえって副作用があったりします。副作用としては、例えば、動詞「サチ-る」と名詞「サチ」(人名など) のように、語幹が共通だけど意味が異なる形態素が混在し、品詞識別が難しくなるという意図せぬ状態が生じたりします。このように一つの語幹が複数の品詞を想定すると、かなり多くの用例を集める必要がでてきます。雑多な内容のウェブページを集めてくると、こうした予期しない症状がしばしば発生します。単純にデータを増やせば幸せになれるとも限らないのではないかと最近考えています。
村脇有吾, 黒橋禎夫.
形態論的制約を用いた未知語の自動獲得.
言語処理学会第14回年次大会, pp. 805-808, 東京, 2008.3.
[paper] [slides]

テキストから形態素解析器の辞書に足りない語彙を獲得して、直接解析器の辞書を更新。見切り発車で、内容はかなり混乱している。EMNLP2008 で改善したつもり。
村脇有吾.
マイナー言語に対する言語処理基盤開発 --キリル文字モンゴル語の場合--.
第49回プログラミング・シンポジウム報告, pp. 141-148, 神奈川, 2008.1.

未踏ユースの成果を報告したもの。単著。NLP 業界とは雰囲気が違う。いろいろ失敗。モンゴル語の処理は、そのうちきちんと整理したいと思いつつ、ずるずる引きのばしている。
村脇有吾, 黒橋禎夫.
情報分析のための述語項構造を用いた動的オントロジー構築.
言語処理学会第13回年次大会, pp. 867-870, 滋賀, 2007.3.
[paper]

アイデア一発もの。KNP が格解析を行って述語項構造を出力するようになっているので、これをそのまま利用者に見せれば、単なるキーワードの羅列よりは内容が理解できるのではないかと考えた。実際には項に入る複合名詞の整理が大変だったり、問題山積みのまま研究テーマを変更。ちなみに、やっぱりこれはオントロジーではないと思っている。

Invited Talks

村脇有吾.
説明可能な人間としてのニューラルネットワーク: 対照研究の新手法.
Joint Conference of the Technical Group of Thought and Language and Mental Architecture for Processing and Learning of Language (TL/MAPLL), online, 2021.9.
[author manuscript] [paper] [conference site] [slides]

基調講演。Neural Network as an Explainable Human: A New Approach to Contrastive Studies.
村脇有吾.
言語系統論への計算的アプローチの可能性.
日本歴史言語学会2017年大会公開シンポジウム言語系統論の過去 (これまで) と未来 (これから), 吹田, 2017.12.
[slides]

done.
村脇有吾.
言語進化史の統計的研究.
言語処理学会第22回年次大会 (NLP2016) チュートリアル, 仙台, 2016.3.
[slides]

done.
村脇有吾.
諸言語の歴史的変化に対する数理的取り組み.
情報処理学会第220回自然言語処理研究会招待講演, 福岡, 2015.1.
[slides]

done.

Book Chapters

村脇有吾.
方言群の時空間動態の統計的モデル化に向けての予備的考察.
木部暢子, 林由華, 衣畑智秀編. フィールドと文献から見る日琉諸語の系統と歴史. pp. 163-187. 開拓社. 2021.9.
[publisher's page]
村脇有吾.
言語系統論.
金明哲ほか編. 文化情報学事典. pp. 85-91. 勉誠出版. 2019.12.

done.

Review Papers

菅原朔, 村脇有吾, 宮尾祐介.
大規模言語モデルの評価とその課題.
人工知能学会誌, Vol. 39, No. 6, pp. 788-796. (2024.11).
[J-STAGE]

llm-jp 関連。
村脇有吾.
学会記事: Latent Geographical Factors for Analyzing the Evolution of Dialects in Contact.
自然言語処理, Vol. 28, No. 1, pp. 281-286. (2021.3).
[J-STAGE]

EMNLP2020 の論文の解説。
村脇有吾.
基本語順の歴史的変化の数理モデル.
数学セミナー, 2020年3月号, pp. 36-40. (2020.3).
[final draft]

日本評論社の雑誌。Computational Linguistics (2019) と EMNLP (2018) の内容を一般向けに紹介したもの。田中久美子先生企画の「言語と数理」特集。
村脇有吾.
言語系統論への計算的アプローチの可能性.
歴史言語学, 7, pp. 77-91. (2018.12).
[amazon.co.jp]

2017年12月のシンポジウムの発表を論文形式にしたもの。
村脇有吾.
言語変化と系統への統計的アプローチ.
統計数理, 64(2), pp. 161-178. (2016.12).
[abstract] [paper]

特集「統計的言語研究の現在」の一部。2015 年 9 月の講演内容を土台にして執筆。書誌的には2016年12月発行となっているが、公開されたのは2017年3月3日。
村脇有吾.
言語系統解明のための計算的取り組み.
人工知能, 31(6), pp. 780-786. (2016.11).
[AI書庫] [author manuscript] [errata]

特集「人工知能と歴史」の原稿。統計数理よりも後から依頼が来たけど先に出る。後から書いた分、頭の中の整理が進んでいる。
森信介, 鍜治伸裕, 村脇有吾, 斉藤いつみ.
形態素解析 (特集: 自然言語処理技術の現状と展望: エラー分析プロジェクトを通して).
情報処理, 57(2), pp. 10-11, (2015.12).
[IPSJ]

特集「自然言語処理技術の現状と展望 (エラー分析プロジェクトを通して)」。一部を分担。エラー分析プロジェクトは、呼ばれて参加してみたものの、やりたいことがエラー分析ではないことに途中で気付いてしまった。とはいえ次につながる収穫が得られたので全体として良かった。
村脇有吾.
研究会推薦博士論文速報: Automatic Acquisition of Japanese Unknown Morphemes.
情報処理, 53(3), p.289, (2012.2).
[IPSJ]

研究会推薦なのに該当研究会で発表したことがなくて申し訳ない。

Talks (without Proceedings)

村脇有吾.
コンピュータに数学を解かせる.
明和高校数学夏の学校, 名古屋, 2025.7.
[slides]

高校からの依頼。
Yugo Murawaki.
Toward Open Science in Linguistics: Adapting Practices in Japan.
The Kickoff Meeting of the JSPS International Leading Research Project, Suita, 2025.4.
[slides] [program]
鐘承志, 程飛, 劉倩瑩, 江俊锋, 万振, 褚晨翚, 村脇有吾, 黒橋禎夫.
What language do Japanese-specialized large language models think in?
第13回AAMTセミナー, online, 2025.3. (最優秀賞受賞)
[program]
村脇有吾.
言語群の統計的時空間解析・ベイズ系統分析・大規模言語モデル応用.
「時空言語学」の創成: 地理と歴史を融合した言語変化と発展への新たなアプローチ国内メンバー打ち合わせ, 吹田, 2025.3.

内輪イベント
Yugo Murawaki.
When Does Phylogenetic Analysis Go Wrong?
2024 Fiji Language GIS Project Symposium, Suva, Fiji, 2024.9.
[slides] [symposium site]
村脇有吾.
確率的言語モデル入門.
明和高校数学夏の学校, 名古屋, 2024.7.

高校からの依頼。
村脇有吾.
文字レベル言語モデルから単語レベル言語モデルへ: 上位存在に俺はなる!
第15回入力メソッドワークショップ (IM 2023), 京都, 2023.12.

lightening talk.
Yugo Murawaki.
Toward Statistical Analysis of Spatio-Temporal Dynamics of Dialects.
International Symposium and Workshop "Compiling GIS for Integrating Linguistic and Non-linguistic Information", Suita, Japan, 2023.9.
[symposium program]
村脇有吾.
確率的言語モデルとステガノグラフィ.
明和高校数学夏の学校, 名古屋, 2023.8.
[slides]

高校からの依頼。
村脇有吾.
言語変化の数理.
第24回京都大学情報学シンポジウム「文理融合の中核となる情報学」, 京都, 2023.2.
[slides]

研究科のイベント。
村脇有吾.
言語ステガノグラフィと分割曖昧性問題.
第13回入力メソッドワークショップ (IM 2021), 京都, 2021.12.

毎年恒例の。
村脇有吾.
方言群の分析のための分岐と伝播の統合的モデル化.
シンポジウム「日琉諸方言系統論の展望」, online, 2020.12.
[symposium site]

国語研のイベントだが online 化。
坂田亘, 田中リベカ, 児玉貴志, 新隼人, 村脇有吾, 河原大輔, 黒橋禎夫.
知識に基づくニューラル対話基盤の構築.
京都大学第14回 ICT イノベーション, 京都, 2020.2.
Yugo Murawaki.
Relaxing the Tree Constraint.
Fijian Languages Symposium, Palmerston North, New Zealand, 2020.1.
[symposium program]
村脇有吾.
統語的語の認定問題.
Universal Dependencies シンポジウム, 立川, 2019.9.
[slides] [symposium program]

「言語資源活用ワークショップ2019」に埋め込まれている。
Yugo Murawaki.
Toward Spatio-Temporal Analysis of Dialects of Fijian.
Fijian Languages, Maps and Beyond: An Interim Report of the Fijian Language GIS (Geographic Information System) Project, Suva, Fiji, 2019.3.
村脇有吾.
方言群の時空間解析にむけて: フィジー語を例に.
新学術領域・ヤポネシアゲノム・言語班2018年度第2回研究集会, 石垣, 2019.2.
[abstract] [slides]

言語班代表の遠藤先生に誘われて。スライドに訂正あり。
村脇有吾.
潜在表現を用いた言語変化の通時的分析.
京都大学第13回 ICT イノベーション, 京都, 2019.2.
[abstract] [poster]

お仕事。実際に使ったポスターから変更あり (1箇所誤字を修正)。
柴田知秀, 坂田亘, 田中リベカ, 村脇有吾河原大輔, 黒橋禎夫.
知識に基づく構造的言語処理の確立と知識インフラの構築.
京都大学第13回 ICT イノベーション, 京都, 2019.2.
[abstract]

お仕事。
Yugo Murawaki.
Exploring Correlated Evolution with Latent Representations.
University of Zürich, Zürich, Switzerland, 2018.3.
[slides]
村脇有吾.
潜在表現に基づく言語構造の史的変化の分析.
機構間連携・文理融合プロジェクト「言語における系統・変異・多様性とその数理」シンポジウム, 東京, 2018.2.
[slides] [symposium site]

at TKP東京駅大手町カンファレンスセンター.
村脇有吾.
Universal DependenciesとSyntactic Wordの闇. 第9回入力メソッドワークショップ (IM 2017), 京都, 2017.12.
[lightning talk slides]

毎年恒例の。
村脇有吾.
言語類型論の特徴からの潜在表現の獲得とその歴史的変化の分析への応用.
機構間連携・文理融合プロジェクト「言語における系統・変異・多様性とその数理」研究発表会, 立川, 2017.12.
[slides] [workshop site]

国語研で。
村脇有吾.
言語の構造的特徴はなぜ、どのように変化するのか.
NLP若手の会 (YANS) 第12回シンポジウム, 那覇, 2017.9.
[booster] [poster]

運営委員をやっていたけど空気を読まずに発表。今年で任期はおしまい。IJCNLP 2017 の話と今後の方向性。
村脇有吾.
語の認定とそれに付随する提案.
UD Japanese 打ち合わせ, 京都, 2017.6.
[slides]
村脇有吾, 森信介.
単語分割とWikificationの同時解析.
NLP若手の会 (YANS) 第11回シンポジウム, 白浜, 2016.8.

運営委員をやっていたけど空気を読まずに発表。
村脇有吾.
言語変化と系統への統計的アプローチ.
国立国語研究所・統計数理研究所合同研究集会「統計的言語研究の現在」, 立川, 2015.9.
[slides]

予稿集なし。コーパス日本語学ワークショップ2015・サテライトシンポジウム http://www.ism.ac.jp/~daichi/workshop/2015-statling/ 後日『統計数理』に執筆予定。
村脇有吾.
類型論から統計的に日本語の系統を考える.
名古屋地区NLPセミナー, 名古屋, 2015.5.

予稿集なし。https://sites.google.com/site/nagoyanlpseminar/home
村脇有吾.
語彙拡散の空間構造モデル.
統計数理研究所共同研究集会「社会物理学の現代的課題」, 立川, 2015.3.

予稿集なし。
鍜治伸裕, 森信介, 高橋文彦, 笹田鉄朗, 斉藤いつみ, 服部圭吾, 村脇有吾, 内海慶.
形態素解析のエラー分析.
エラー分析ワークショップ (言語処理学会年次大会2015), 京都, 2015.3.

実質的に何もしていないけど、次のネタを仕込む役には立った。
村脇有吾, 黒橋禎夫.
テキスト解析を用いた講演における聞き手理解支援.
京都大学 ICT イノベーション2013, 京都, 2013.2.
[abstract]

お仕事。
進義治, 柴田知秀, 村脇有吾, 河原大輔, 黒橋禎夫.
大規模語彙意味辞書に基づく実テキスト解析.
京都大学 ICT イノベーション2013, 京都 (2013.2).
[abstract]

お仕事。
Yugo Murawaki.
Online Acquisition of Japanese Unknown Morphemes from Text.
Second GCOE Kyoto-Berkeley Workshop, Kyoto (2010.3).

専門外の人たち。日本語のテキストが読める人は少ないだろうと思っていたら誰もいなかった。いろいろ割切って発表。
村脇有吾.
自然言語の解析のためのテキストからの語彙の自動獲得.
京都大学 ICT イノベーション2010, 京都 (2010.2).
[abstract] [poster]

企業の人などが来るということで、分野外の人への説明に気をつけてみる。思い切って中身の話をばっさり削ってみた。
村脇有吾.
オンライン未知語獲得.
IM 飲み会2009, 京都 (2009.12).
[slides]

河原研のミーティングルームを借りて行われたもの。実は2002年からやっているそうだけど、私は初参加。参加者の目的が実用的なアプリケーションを作ることにある。学会とは違う感じで、それはそれで楽しい。
村脇有吾.
自律的な知識獲得に基づく自然言語の解析.
GCOE 若手リーダーシップ養成プログラム中間報告会 (2009.11).

「GCOE 若手リーダーシップ養成プログラム」に採用されているので、その中間報告。発表10分、質疑応答5分。
村脇有吾.
形態素解析へのフィードバックのための未知語の自動獲得.
情報学若手コロキアム第7回 (2008.12).
[slides]

基本的に EMNLP2008 のネタ。情報学若手コロキアムは、大学の研究科の輪講みたいなもの。助教や上回の博士過程でまわしていたはずが、ネタぎれでまわってきた。時系列的な変化は、ポスターだと表現しにくいけど、スライドだとアニメーションのおかげでまだ説明しやすいことを再確認。
村脇有吾.
自然言語処理における知識獲得のためのクラスタ環境の利用.
第2回 InTrigger Community Workshop, 東京 (2008.6).
[slides]

InTrigger は私が大規模計算に使わせていただいている計算機クラスタのクラスタ。報告の内容は、並列化やデータの管理など、研究よりもプログラムに関すること。果して役に立ったのか不安。
村脇有吾.
キリル文字モンゴル語形態素解析器の開発.
2006年度下期未踏ユース成果報告会, 東京 (2007.8).

誰に何を話せばよいのかよくわからないまま突撃して失敗。かなり反省。

Miscellaneous

知能情報メディア講座言語メディア分野.
言語ステガノグラフィ.
cue, 第50号, p. 24, 2023.9.
[PDF]

京都大学電気関係教室技術情報誌。研究室名で出していて私の名前は記載されていない。
国立民族学博物館特別展 Homō loquēns 「しゃべるヒト」ことばの不思議を科学する: ポスター研究展示.
2022.09.01-2022.11.23.
言語学第二座談会 (後半の部).
Yaponesian, 第2巻あき号, 2020.
[article]

文部科学省科学研究費補助金新学術領域研究「ゲノム配列を核としたヤポネシア人の起源と成立の解明」(領域略称名: ヤポネシアゲノム) の座談会。2020年1月千葉大学にて。
知能情報メディア講座言語メディア分野 (黒橋研究室).
言語の多様な構造的特徴に関する研究.
cue, 第40号, p. 27, 2018.9.
[PDF]

京都大学電気関係教室技術情報誌。研究室名で出していて私の名前は記載されていない。
村脇有吾.
編集後記.
自然言語処理, Vol.24, No.2, pp. 315-316, 2017.3.

編集後記を書くということはその号の論文を全部読むということ。編集後記は J-STAGE では公開されないらしい。
村脇有吾.
新任スタッフの抱負.
情報学広報, 第18号, p. 9, 2016.
[PDF]

京都大学大学院情報学研究科の広報。新任スタッフは寄稿を求められる。『情報学広報』は私の名前をよく「脇村」と間違える。
知能情報メディア講座言語メディア分野（黒橋研究室).
実テキスト解析をささえる語彙知識の自動獲得.
cue, 第28号, p. 23, 2012.9.
[PDF]

京都大学電気関係教室技術情報誌。研究室名で出していて私の名前は記載されていない。
村脇有吾.
博士論文概要: Automatic Acquisition of Japanese Unknown Morphemes (日本語未知語の自動獲得).
cue, 第27号, p. 48, 2012.3.
[PDF]

京都大学電気関係教室技術情報誌。
村脇有吾.
平成19年度修士論文テーマ紹介: 形態論的制約に基づく実テキストからの語彙の自動獲得.
cue, 第20号, p. 41, 2008.9.
[PDF]

京都大学電気関係教室技術情報誌。

Research Grants (Principal Investigator)

栢森情報科学振興財団研究助成, 100万円 (2025年1月-2025年9月)
課題名: 普遍的規準の適用に基づく大規模言語モデルの公正性の基礎研究
科学研究費補助金基盤研究(C), 360万円 (2024年4月-2027年3月)
課題名: 潜在表現に基づく言語の構造的変化の解明
科学研究費補助金基盤研究(C), 429万円 (2021年4月-2024年3月)
課題名: 文化進化の分析のための分岐と伝播の統合的モデル化
科学研究費補助金若手研究, 416万円 (2018年4月-2021年3月)
課題名: 計算的取り組みによる言語の歴史的変化の解明
科学研究費補助金若手研究(B), 364万円 (2014年4月-2018年3月)
課題名: 統計的手法による日本語諸方言の系統樹推定
情報処理推進機構 (IPA) 未踏ソフトウェア創造事業未踏ユース, 2006年度下期開発者, 255万円, (2007年2月-2007年8月)
開発テーマ: キリル文字モンゴル語形態素解析器の開発

Research Grants (Collaborator)

科学研究費補助金国際先導研究, 68,861万円 (2024年度-2030年度)
課題名: 「時空言語学」の創成: 地理と歴史を融合した言語の変化と発展への新たなアプローチ (研究代表: 菊澤律子)
科学研究費補助金国際共同研究加速基金 (国際共同研究強化 (B)), 1,807万円 (2018年度-2024 (2023)年度)
課題名: 時空間を融合する: GISと数理モデルを用いた新たな言語変化へのアプローチ (研究代表: 菊澤律子)
科学研究費補助金基盤研究(C), 442万円 (2018年4月-2021年3月)
課題名: 実世界と可能世界が参照可能であるテキストの日本語モダリティ解析 (研究代表: 松吉俊)
機構間連携文理融合プロジェクト調査研究 (統数研・民博・国語研), 80万円 (2017年度)
課題名: 言語における系統・変異・多様性とその数理 (研究代表: 持橋大地)

職歴?

暫定的にここに置く。

2023年8月-現在: 京都大学大学院情報学研究科知能情報学准専攻准教授 (工学部兼担)
2017年10月-2021年3月: 国立国語研究所共同研究プロジェクト「コーパスアノテーションの拡張・統合・自動化に関する基礎研究」共同研究員
2020年11月-2023年7月: 京都大学大学院情報学研究科知能情報学専攻講師 (工学部兼担)
2016年4月-2020年10月: 京都大学大学院情報学研究科知能情報学専攻助教 (工学部兼担)
2016年1月-2016年3月: 京都大学大学院情報学研究科知能情報学専攻特定助教 (工学部兼担)
2013年10月-2015年12月: 九州大学大学院システム情報科学研究院情報知能工学部門助教 (工学部電気情報工学科兼担)
2011年4月-2013年9月: 京都大学学術情報メディアセンター特定助教
2010年9月-2011年3月: 京都大学学術情報メディアセンターリサーチ・アシスタント
2010年6月-2010年8月: Apple, Inc. インターン
2010年4月-2010年5月: 京都大学学術情報メディアセンターオフィス・アシスタント
2009年7月-2010年3月: 京都大学グローバルCOE「知識循環社会のための情報学教育研究拠点」平成20年度若手リーダーシップ養成プログラム
2008年4月-2010年3月: 京都大学グローバルCOE「知識循環社会のための情報学教育研究拠点」リサーチアシスタント
2007年2月-2007年8月: 情報処理推進機構 (IPA) 未踏ソフトウェア創造事業未踏ユース2006年度下期開発者 (開発テーマ: キリル文字モンゴル語形態素解析器の開発)

学会等:

2025年: 言語処理学会第31回年次大会 (NLP2025) テーマセッション「人文学と言語処理」提案者 (他44名と)
2024年: 言語処理学会第30回年次大会 (NLP2024) テーマセッション「ことばと地理空間の情報処理」提案者 (他26名と)
2021年: IJCNLP-AACL 2023: Faculty Advisor for the Student Research Workshop
2021-2023年: TACL standing review committee
2020.06-: 情洛会事務局員
2020-2022年: Associate Editor of ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP)
2019年-2023年 (2期): 情報処理学会論文誌ジャーナル/JIP編集委員
2019年: デジタルアーカイブ学会第 3 回研究大会実行委員 (現地運営担当)
2016-2017年: NLP 若手の会 (YANS) プログラム委員
2015-2019年 (2期): 言語処理学会編集委員
2015-2019年 (2期): 情報処理学会自然言語処理研究運営委員会運営委員
2016年: COLING 2016, the 26th International Conference on Computational Linguistics: Student Volunteer Coordinator
2015年: 言語処理学会第21回年次大会 (NLP2015) テーマセッション「言語探求のための数理的アプローチ」提案者 (他2名と)
2014年: 言語処理学会第20回年次大会 (NLP2014) テーマセッション「言語探究の手段としての言語処理」提案者 (他4名と)
2014年度: 情洛会庶務幹事 (異動につき、9月に前年度庶務幹事に交代)
2012-2013年: 言語処理学会第19回年次大会 (NLP2013) プログラム委員
2011-2012年: 言語処理学会第18回年次大会 (NLP2012) プログラム委員

担当授業等:

2025年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2025年度後期: 統計入門 (京都大学全学共通科目)
2025年度前期: インフォメーションデザイン論 (京都大学大学院情報学研究科) (ゲスト講義1回)
2025年度前期: 情報科学基礎論 (京都大学大学院情報学研究科知能情報学コース)
2025年度前期: 電気電子プログラミング及演習 (京都大学工学部電気電子工学科)
2024年度前期: Language Information Processing, Adv. (京都大学大学院情報学研究科知能情報学コース)
2024年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2024年度後期: 統計入門 (京都大学全学共通科目)
2024年度前期: 電気電子プログラミング及演習 (京都大学工学部電気電子工学科)
2024年度前期: 情報科学基礎論 (京都大学大学院情報学研究科知能情報学コース)
2024年度前期: Language Information Processing, Adv. (京都大学大学院情報学研究科知能情報学コース)
2023年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2023年度後期: 統計入門 (京都大学全学共通科目)
2023年度前期: インフォメーションデザイン論 (京都大学大学院情報学研究科) (ゲスト講義1回)
2023年度前期: 電気電子プログラミング及演習 (京都大学工学部電気電子工学科)
2023年度前期: 情報科学基礎論 (京都大学大学院情報学研究科知能情報学コース)
2023年度前期: Language Information Processing, Adv. (京都大学大学院情報学研究科知能情報学コース)
2022年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2022年度後期: 電気電子工学概論 (京都大学工学部電気電子工学科) (取りまとめ)
2022年度後期: 統計入門 (京都大学全学共通科目)
2022年度前期: Language Information Processing, Adv. (京都大学大学院情報学研究科知能情報学専攻)
2021年度後期: 統計入門 (京都大学全学共通科目)
2021年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2021年度後期: 電気電子工学概論 (京都大学工学部電気電子工学科) (取りまとめ)
2021年度前期: 知能情報学セミナーI, II (京都大学大学院情報学研究科知能情報学専攻) (取りまとめ)
2021年度前期: Language Information Processing, Adv. (京都大学大学院情報学研究科知能情報学専攻)
2020年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2020年度前期: Language Information Processing, Adv. (京都大学大学院情報学研究科知能情報学専攻)
2019年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2018年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2017年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2016年度後期: 電気電子計算工学及演習 (京都大学工学部電気電子工学科)
2015年度前期: 電気情報工学実験I, 論理設計演習 (九州大学工学部電気情報工学科)
2014年度前期: 電気情報工学実験I, 論理設計演習 (九州大学工学部電気情報工学科)
2013年度後期: 電気情報工学実験II, システムプログラミング演習 (九州大学工学部電気情報工学科)