Publications

Preprints

  1. Yugo Murawaki.
    On the Definition of Japanese Word.
    arXiv 1906.09719, June, 2019.
    [arXiv]
    初 arXiv。

Journal Papers (Refereed)

  1. Hirotaka Kameko, Yugo Murawaki, Suguru Matsuyoshi, and Shisuke Mori.
    Japanese Event Factuality Analysis in the Era of BERT.
    IEEE Access. Vol. 11, pp. 93286-93292, 2023.
    [paper]
  2. 岡久 太郎, 田中 リベカ, 児玉 貴志, Yin Jou Huang, 村脇 有吾, 黒橋 禎夫.
    コツを引き出す対話設定におけるオンライン料理インタビュー対話コーパスの構築.
    自然言語処理, Vol 30, No. 2, pp. 773-799, 2023.(technical paper).
    [J-STAGE]
    査読付き技術資料。
  3. 田中 佑, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの構築.
    自然言語処理, Vol 28, No. 4, pp. 995-1033, 2021.
    [J-STAGE]
  4. 亀甲 博貴, 松吉 俊, John Richardson, 牛久 敦, 笹田 鉄郎, 村脇 有吾, 鶴岡 慶雅, 森 信介.
    将棋解説文への固有表現・モダリティ情報アノテーション.
    自然言語処理, Vol 28, No. 3, pp. 847-873, 2021.
    [J-STAGE]
  5. 岸本 裕大, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    日本語談話関係解析: タスク設計・談話標識の自動認識・コーパスアノテーション.
    自然言語処理, Vol 27, No. 4, pp. 889-931, 2020.
    [J-STAGE]
  6. Yugo Murawaki.
    Bayesian Learning of Latent Representations of Language Structures.
    Computational Linguistics 45(2), pp. 199-228, 2019.
    [abstract] [full text] [code]
    IJCNLP 2017 の内容を拡大したもの。Submission received: 15 July 2018; Revised version received: 28 December 2018; Accepted for publication: 8 February 2019.
  7. 浅原 正幸, 金山 博, 宮尾 祐介, 田中 貴秋, 大村 舞, 村脇 有吾, 松本 裕治.
    Universal Dependencies日本語コーパス.
    自然言語処理, Vol 26, No. 1, pp. 3-36, 2019.
    [J-STAGE]
    http://www.anlp.jp/abst/vol26/no1.html
  8. Yugo Murawaki and Kenji Yamauchi.
    A Statistical Model for the Joint Inference of Vertical Stability and Horizontal Diffusibility of Typological Features.
    Journal of Language Evolution 3(1), pp. 13-25, 2018.
    [article] [accepted manuscript] [supplementary material] [code]
    COLING2016 のネタを大拡張したもの。The OUP allows the authors to make their accepted manuscript available on their non-commercial homepage or blog after publication. No longer paywalled.
  9. Yugo Murawaki.
    Spatial Structure of Evolutionary Models of Dialects in Contact.
    PLOS ONE 10(7): e0134335 (15 pages), 2015.
    [full text] [code]
    YANS 2014 の内容をそのままジャーナル化したもの。
  10. 村脇 有吾.
    階層的複数ラベル文書分類におけるラベル間依存の利用.
    自然言語処理, Vol.21, No.1, pp. 41-60, 2014.
    [J-STAGE]
    IJCNLP2014 のネタをジャーナル化したもの。期間終了後はデータを破棄する契約なので再現実験はできない。論文では所属を九大にしたけど、京大在籍時の成果。一応初版投稿時点では京大に在籍していた。
  11. 村脇 有吾, 黒橋 禎夫.
    形態論的制約を用いたオンライン未知語獲得.
    自然言語処理, Vol.17, No.1, pp. 55-75, 2010.
    [J-STAGE] [code]
    EMNLP 2008 のネタをジャーナル化したもの。

International Conferences (Refereed)

  1. Taishi Chika, Taro Okahisa, Takashi Kodama, Yin Jou Huang, Yugo Murawaki and Sadao Kurohashi.
    Domain Transferable Semantic Frames for Technical Interview Dialogues.
    In Proceedings of LREC-COLING 2024, pp. ???-???, Turin, Italy, May 2024. (to appear).
  2. Norizo Sakaguchi, Yugo Murawaki, Chenhui Chu and Sadao Kurohashi.
    Identifying Source Language Expressions for Pre-editing in Machine Translation.
    In Proceedings of LREC-COLING 2024, pp. ???-???, Turin, Italy, May 2024. (to appear).
    oral. 卒業した学生に代わって私が発表。
  3. Yugo Murawaki.
    Principal Component Analysis as a Sanity Check for Bayesian Phylolinguistic Reconstruction.
    In Proceedings of LREC-COLING 2024, pp. ???-???, Turin, Italy, May 2024. (to appear).
    [code] [arXiv]
    poster.
  4. Nobuhiro Ueda, Kazumasa Omura, Takashi Kodama, Hirokazu Kiyomaru, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
    KWJA: A Unified Japanese Analyzer Based on Foundation Models.
    In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics: System Demonstrations (ACL 2023), pp. 538-548, Toronto, Canada, July, 2023. (system demonstration).
    [paper] [code]
    NL研の発表がベース。
  5. Jumon Nozaki and Yugo Murawaki.
    Addressing Segmentation Ambiguity in Neural Linguistic Steganography.
    In Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (AACL-IJCNLP 2022), pp. 109-116, online, November, 2022. (short paper).
    [paper] [arXiv] [author manuscript] [code]
    台湾で開催されるはずだった会議。ポスター発表。
  6. Masato Umakoshi, Yugo Murawaki and Sadao Kurohashi.
    Japanese Zero Anaphora Resolution Can Benefit from Parallel Texts Through Neural Transfer Learning.
    In Findings of the Association for Computational Linguistics: EMNLP 2021, pp. 1920-1934, Punta Cana, Dominican Republic/online, November, 2021. (findings).
    [paper]
    video.
  7. Honai Ueoka, Yugo Murawaki and Sadao Kurohashi.
    Frustratingly Easy Edit-based Linguistic Steganography with a Masked Language Model.
    In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2021), pp. 5486-5492, online, June 2021. (short paper).
    [paper] [video] [code] [arXiv]
    Mexico City -> online.
  8. Oleksandr Harust, Yugo Murawaki and Sadao Kurohashi.
    Native-like Expression Identification by Contrasting Native and Proficient Second Language Speakers.
    In Proceedings of COLING 2020, the 28th International Conference on Computational Linguistics: Technical Papers, pp. 5843-5854, online, December 2020.
    [paper] [video]
    Supposed to be held in Barcelona. Oral.
  9. Akiko Aizawa, Frederic Bergeron, Junjie Chen, Fei Cheng, Katsuhiko Hayashi, Kentaro Inui, Hiroyoshi Ito, Daisuke Kawahara, Masaru Kitsuregawa, Hirokazu Kiyomaru, Masaki Kobayashi, Takashi Kodama, Sadao Kurohashi, Qianying Liu, Masaki Matsubara, Yusuke Miyao, Atsuyuki Morishima, Yugo Murawaki, Kazumasa Omura, Haiyue Song, Eiichiro Sumita, Shinji Suzuki, Ribeka Tanaka, Yu Tanaka, Masashi Toyoda, Nobuhiro Ueda, Honai Ueoka, Masao Utiyama, and Ying Zhong.
    A System for Worldwide COVID-19 Information Aggregation.
    Workshop on NLP for COVID-19 (Part 2) at EMNLP 2020, online, November 2020. (workshop)
    [paper] [OpenReview] [ACL2020 workshop poster] [ACL2020 workshop video] [website]
  10. Yugo Murawaki.
    Latent Geographical Factors for Analyzing the Evolution of Dialects in Contact.
    In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), pp. 959-976, online, November 2020.
    [paper] [slides] [code]
    Supposed to be held in Punta Cana. Gather Session (=~ poster presentation though I submitted a pre-recorded talk).
  11. Yu Tanaka, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
    Building a Japanese Typo Dataset from Wikipedia's Revision History.
    In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2020 SRW), pp. 230-236, online, July 2020. (student research workshop).
    [paper] [dataset]
    The physical conference in Seattle was cancelled.
  12. Yudai Kishimoto, Yugo Murawaki and Sadao Kurohashi.
    Adapting BERT to Implicit Discourse Relation Classification with a Focus on Discourse Connectives.
    In Proceedings of the 12th Edition of the Language Resources and Evaluation Conference (LREC 2020), pp. 1152-1158, (meeting cancelled), May 2020.
    [paper]
    supposed to be an oral presentation, but the conference was cancelled. Marseille, France. No online meeting.
  13. Jun Saito, Yugo Murawaki and Sadao Kurohashi.
    Minimally Supervised Learning of Affective Events Using Discourse Relations.
    In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP 2019), pp. 5762-5769, Hong Kong, November 2019. (short paper).
    [paper] [arXiv]
    oral.
  14. Hirokazu Kiyomaru, Kazumasa Omura, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
    Diversity-aware Event Prediction based on a Conditional Variational Autoencoder with Reconstruction.
    In Proceedings of the First Workshop on Commonsense Inference in Natural Language Processing (COIN), pp. 113-122, Hong Kong, November 2019. (workshop).
    [paper] [code]
    An EMNLP-IJCNLP 2019 workshop. Acceptance ratio: 16 / 22 (source: slides of the opening talk).
  15. Suzushi Tomori, Yugo Murawaki and Shinsuke Mori.
    A Hybrid Generative/Discriminative Model for Rapid Prototyping of Domain-Specific Named Entity Recognition.
    In 20th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2019), 16 pages, La Rochelle, France, April 2019.
    [paper] [EasyChair preprint]
    Selected for the main proceedings volume of Springer LNCS. Poster.
  16. Yugo Murawaki.
    Analyzing Correlated Evolution of Multiple Features Using Latent Representations.
    In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP2018), pp. 4371-4382, Brussels, Belgium, November 2018.
    [paper] [supplementary material] [slides] [code]
    oral presentation.
  17. Yudai Kishimoto, Yugo Murawaki and Sadao Kurohashi.
    A Knowledge-Augmented Neural Network Model for Implicit Discourse Relation Classification.
    In Proceedings of COLING 2018, the 27th International Conference on Computational Linguistics: Technical Papers, pp. 584-595, Santa Fe, New Mexico, U.S., August 2018. (Area Chair Favorite).
    [paper]
    Area Chair Favorite (including Best Papers): (34 + 8) / 331 = 0.127
  18. Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.
    Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations.
    In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC 2018), pp. 4044-4048, Miyazaki, Japan, May 2018.
    [paper]
    poster.
  19. Suguru Matsuyoshi, Hirotaka Kameko, Yugo Murawaki and Shinsuke Mori.
    Annotating Modality Expressions and Event Factuality for a Japanese Chess Commentary Corpus.
    In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC 2018), pp. 2475-2481, Miyazaki, Japan, May 2018.
    [paper] [corpus]
    poster.
  20. Masayuki Asahara, Hiroshi Kanayama, Takaaki Tanaka, Yusuke Miyao, Sumire Uematsu, Shinsuke Mori, Yuji Matsumoto, Mai Omura and Yugo Murawaki.
    Universal Dependencies Version 2 for Japanese.
    In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC 2018), pp. 1824-1831, Miyazaki, Japan, May 2018.
    [paper]
    Oral presentation.
  21. Yugo Murawaki.
    Diachrony-aware Induction of Binary Latent Representations from Typological Features.
    In Proceedings of the 8th International Joint Conference on Natural Language Processing (IJCNLP 2017), pp. 451-461, Taipei, Taiwan, November 2017.
    [paper] [supplementary material] [slides] [code]
    Oral presentation.
  22. Kenji Yamauchi and Yugo Murawaki.
    Contrasting Vertical and Horizontal Transmission of Typological Features.
    In Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers. pp. 836-846, Osaka, Japan. December 2016.
    [paper] [errata] [code]
    研究費が年に1回しか国際会議に行けないほど少額で、そのカードを NAACL2016 で使ってしまっていたが、国内開催だったから行けた。
  23. Yugo Murawaki.
    Statistical Modeling of Creole Genesis.
    In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2016), pp. 1329-1339, San Diego, California, June 2016.
    [paper] [slides] [code]
    NLP2016 で話したのと同じ内容。NLP2016 の発表のちょうど 1 週間前に採択通知が来た。
  24. Yugo Murawaki and Shinsuke Mori.
    Wikification for Scriptio Continua.
    In Proceedings of the 10th Edition of the Language Resources and Evaluation Conference (LREC 2016), pp. 1346-1351, Portorož, Slovenia, May 2016.
    [paper] [errata] [poster] [corpora]
    とりあえずコーパス作成だけで論文にした。久しぶりの LREC。
  25. Yugo Murawaki.
    Continuous Space Representations of Linguistic Typology and their Application to Phylogenetic Inference.
    In Proceedings of the 2015 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2015), pp. 324-334, Denver, Colorado, June 2015.
    [paper] [errata] [poster] [related code]
    NLP2015 で話したのと同じ内容。
  26. Yugo Murawaki.
    Global Model for Hierarchical Multi-Label Text Classification.
    In Proceedings of the Sixth International Joint Conference on Natural Language Processing (IJCNLP 2013), pp. 46-54, Nagoya, Japan, October 2013.
    [paper] [slides]
    Accept-Regular。なぜか単著。九大に移って2週間後ぐらいに会議があったので、論文では京大所属になっている。
  27. Yugo Murawaki and Sadao Kurohashi.
    Semi-Supervised Noun Compound Analysis with Edge and Span Features.
    In Proceedings of COLING 2012: Technical Papers, pp. 1915-1931, Mumbai, India, December 2012.
    [paper] [slides]
    Accept-Waiting-Long から Accept-Reserve へ。どうなることかと思ったが発表できた。ひどいめにあった。PPspliT を使ってスライドをアニメーションごとに分割してから PDF を作成。ページ番号が元ファイルとずれるのを何とかしたい。
  28. Yugo Murawaki and Sadao Kurohashi.
    Non-parametric Bayesian Segmentation of Japanese Noun Phrases.
    In Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing (EMNLP2011), pp. 605-615, Edinburgh, UK, July 2011.
    [paper] [errata] [slides] [related code]
    oral。気をつけたつもりがやっぱり誤植がある。
  29. Yugo Murawaki and Sadao Kurohashi.
    Semantic Classification of Automatically Acquired Nouns using Lexico-Syntactic Clues.
    In Proceedings of COLING 2010: Posters, pp. 876-884, Beijing, China, August 2010.
    [paper] [poster] [related code]
    またしてもポスター。これもやっぱり問題設定問題。昔の人の設計は微妙だったんじゃないかと今となっては思うけど、既にみんながそれに依存してしまっているので、とりあえずそれにあわせてみましょうという話。
  30. Yugo Murawaki and Sadao Kurohashi.
    Online Japanese Unknown Morpheme Detection using Orthographic Variation.
    In Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10), pp. 832-839, Valletta, Malta, May 2010.
    [paper] [related code]
    日本語を扱っているとこういう問題も発生しますという紹介。解法はものすごくいいかげん。
  31. Yugo Murawaki and Sadao Kurohashi.
    Online Acquisition of Japanese Unknown Morphemes using Morphological Constraints.
    In Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing (EMNLP2008), pp. 429-437, Honolulu, Hawaiʻi, October 2008.
    [paper] [errata] [poster] [related code]
    NLP2008 での発表がベースだが、NLP2008 で混乱していた部分を整理したつもり。プログラムは完全に書換えたけど、論文にするとあまり差が出ない。日本語特有の話を説明するのは難儀。

Domestic Conferences and Workshops (with Proceedings)

  1. Namgi Han, 植田 暢大, 大嶽 匡俊, 勝又 智, 鎌田 啓輔, 清丸 寛一, 児玉 貴志, 菅原 朔, Bowen Chen, 松田 寛, 宮尾 祐介, 村脇 有吾, 劉 弘毅.
    llm-jp-eval: 日本語大規模言語モデルの自動評価ツール.
    言語処理学会 第30回年次大会, pp. 2085-2089, 神戸/online, 2024.3.
    [paper]
  2. 清水 周一郎, Yin Jou Huang, 村脇 有吾, Chenhui Chu.
    対話の齟齬と介入による解消: LLM を用いた検討.
    言語処理学会 第30回年次大会, pp. 1492-1497, 神戸/online, 2024.3.
    [paper]
  3. 渡邉 幸暉, 村脇 有吾, 黒橋 禎夫.
    ニューラル分類器の予測の解釈に基づく集団に特徴的なテキスト表現の抽出:アメリカ人を例に.
    言語処理学会 第29回年次大会, pp. 1371-1376, 宜野湾/online, 2023.3. (第1著者 (学生) が若手奨励賞受賞)
    [paper]
  4. 児玉 貴志, 植田 暢大, 大村 和正, 清丸 寛一, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    テキスト生成モデルによる日本語形態素解析.
    言語処理学会 第29回年次大会, pp. 339-344, 宜野湾/online, 2023.3.
    [paper]
  5. 坂口 典三, 村脇 有吾, Chenhui Chu, 黒橋 禎夫.
    ニューラル分類器の予測の解釈に基づく翻訳が難しい表現の検出.
    言語処理学会 第29回年次大会, pp. 21-26, 宜野湾/online, 2023.3.
    [paper]
  6. 植田 暢大, 大村 和正, 児玉 貴志, 清丸 寛一, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    KWJA: 汎用言語モデルに基づく日本語解析器.
    情報処理学会 第253回自然言語処理研究会, pp. 1-14, 京都/online, 2022.9. (優秀研究賞受賞).
    [author manuscript] [IPSJ]
    京大開催。
  7. 馬越 雅人, 村脇 有吾, 黒橋 禎夫.
    翻訳言語モデルを中間タスクとするゼロ照応解析.
    言語処理学会 第28回年次大会, pp. 1936-1941, 浜松/online, 2022.3.
    [author manuscript] [paper]
    現地には行かなかった。
  8. 和田 有輝也, 村脇 有吾, 黒橋 禎夫.
    セミマルコフCRF自己符号化器による教師なし単語分割.
    言語処理学会 第28回年次大会, pp. 806-810, 浜松/online, 2022.3.
    [author manuscript] [paper]
  9. 田中 佑, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良.
    言語処理学会 第27回年次大会, pp. 1540-1545, 北九州/online, 2021.3. (言語資源賞委員特別賞受賞).
    [author manuscript] [paper] [resources]
  10. 尾崎 立一, 橋本 力, 村脇 有吾, 黒橋 禎夫, 颯々野 学.
    Wikipediaからの意外な恩恵事例の抽出.
    言語処理学会 第27回年次大会, pp. 471-475, 北九州/online, 2021.3.
    [author manuscript] [paper]
  11. 田中 佑, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    Wikipediaの修正履歴を用いた日本語入力誤りデータセットの構築.
    言語処理学会 第26回年次大会, pp. 1543-1546, online, 2020.3.
    [author manuscript] [paper]
    茨城大開催からオンライン開催に変更。
  12. 友利 涼, 村脇 有吾, 松吉 俊, 亀甲 博貴, 森 信介.
    モダリティ表現認識・事象の事実性解析の同時学習.
    情報処理学会 第241回自然言語処理研究会, pp. 1-8, 小樽, 2019.8.
    [IPSJ]
  13. 清丸 寛一, 大村 和正, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    Conditional VAEに基づく多様性を考慮したイベント予測.
    言語処理学会 第25回年次大会, pp. 1531-1534, 名古屋, 2019.3.
    [author manuscript] [paper]
  14. 亀甲 博貴, 松吉 俊, 村脇 有吾, 森 信介.
    モンテカルロシミュレーションによる認識的モダリティ表現のグラウンディング手法の検討.
    言語処理学会 第25回年次大会, pp. 731-734, 名古屋, 2019.3.
    [author manuscript] [paper] [slides]
  15. 中川 裕貴, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    クラウドソーシングによる大喜利の面白さの構成要素の分析.
    言語処理学会 第25回年次大会, pp. 233-236, 名古屋, 2019.3. (第1著者 (学生) が若手奨励賞受賞)
    [author manuscript] [paper]
  16. 岸本 裕大, 村脇 有吾, 黒橋 禎夫.
    一般常識を用いた非明示的な談話関係解析.
    言語処理学会 第24回年次大会, pp. 276-279, 岡山, 2018.3.
    [author manuscript] [paper]
  17. 時武 孝介, 村脇 有吾, 黒橋 禎夫.
    ガウス埋め込みに基づく単語の意味の史的変化分析.
    言語処理学会 第24回年次大会, pp. 61-64, 岡山, 2018.3.
    [paper]
  18. 村脇 有吾.
    特徴間の依存関係を考慮した基本語順の史的変化の分析.
    言語処理学会 第24回年次大会, pp. 57-60, 岡山, 2018.3.
    [author manuscript] [paper]
  19. 松吉 俊, 村脇 有吾, 亀甲 博貴, 森 信介.
    将棋解説文へのモダリティ情報アノテーション.
    情報処理学会 第233回自然言語処理研究発表会, pp. 1-9, 宮古島, 2017.10.
    [IPSJ]
    NL研。自分は不参加。
  20. 村脇 有吾.
    言語類型論的特徴からの潜在的2値パラメータの獲得.
    言語処理学会 第23回年次大会, pp. 903-906, つくば, 2017.3.
    [author manuscript] [paper] [slides]
  21. 岸本 裕大, 澤田 晋之介, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    クラウドソーシングを用いた談話関係アノテーションの改良.
    言語処理学会 第23回年次大会, pp. 819-822, つくば, 2017.3.
    [author manuscript] [paper]
    クラウドソーシング以前にタグ付け仕様に検討の余地がある。
  22. 村脇 有吾.
    クレオール形成に対する混合モデル.
    言語処理学会 第22回年次大会, pp. 853-856, 仙台, 2016.3.
    [author manuscript] [paper] [errata] [slides]
    申し込み後発表までに NAACL の採択通知があった。
  23. 村脇 有吾.
    言語類型の連続空間表現とその系統推定への応用.
    言語処理学会 第21回年次大会, pp. 337-340, 京都, 2015.3.
    [author manuscript] [paper] [slides]
    東工大の高村先生、甲南大の永田先生と一緒に企画したテーマセッション「言語探求のための数理的アプローチ」で発表。
  24. 村脇 有吾.
    方言群の語彙は系統樹をなすか.
    NLP若手の会 (YANS) 第9回シンポジウム, 9 pages, 三浦, 2014.9. (奨励賞受賞)
    [author manuscript] [paper] [slides] [related code]
    若手の会のサイトに上げたスライドからは画像の大半を削除しています。原著作者の許可をとるように求められたので。
  25. 村脇 有吾, 粟飯原 俊介, 原田 泰佑, 長尾 真, 田中 久美子.
    意味的逆引き辞書『真言』におけるスコア付け.
    言語処理学会 第20回年次大会, pp. 396-399, 札幌, 2014.3.
    [paper] [errata] [slides]
    前回大会ではお客さんとして聞いていた話。著者数が過去最高。
  26. 村脇 有吾.
    フレーズベースTF-IDF: 名詞句解析の応用.
    情報処理学会 第214回自然言語処理研究会, pp. 1-8, 屋久島, 2013.11.
    [IPSJ] [slides]
    完全電子化の影響で、ページ数が常に1からはじまるらしい。
  27. 村脇 有吾, 黒橋 禎夫.
    名詞句の内部構造を考慮したキーワードのスコア付け.
    言語処理学会 第19回年次大会, pp. 516-519, 名古屋, 2013.3. (若手奨励賞受賞)
    [paper] [slides]
    PPspliT が分割前のページ番号を維持するようになって便利に。
  28. 黒橋 禎夫, 進 義治, 柴田 知秀, 村脇 有吾, 河原 大輔.
    日本語語彙知識の統一的・整合的管理のデザイン.
    言語処理学会 第19回年次大会, pp. 26-29, 名古屋, 2013.3.
    [paper]
    はじめての第4著者。というかボスが第1著者。
  29. 村脇 有吾, 岸本 侑也, 黒橋 禎夫.
    ベイズ学習によるカタカナ複合語の分割.
    言語処理学会 第18回年次大会, pp. 447-450, 広島, 2012.3.
    [paper] [errata] [slides]
    著者が3人になったのははじめて。見切り発車で悲惨な目にあった。
  30. 柴田 知秀, 村脇 有吾, 黒橋 禎夫, 河原 大輔.
    実テキスト解析をささえる語彙知識の自動獲得.
    言語処理学会 第18回年次大会, pp. 81-84, 広島, 2012.3.
    [paper]
    はじめての第2著者。
  31. 村脇 有吾, 黒橋 禎夫.
    日本語未知語のテキストからの自動獲得.
    電子情報通信学会 言語理解とコミュニケーション研究会 (NLC)(第1回 テキストマイニング・シンポジウム), 東京, 2011.7.
    [author manuscript] [slides]
    未知語獲得の一連の研究をまとめてみた。
  32. 村脇 有吾, 黒橋 禎夫.
    混成型別サンプリングを用いた名詞句分割.
    言語処理学会 第17回年次大会, pp. 564-567, 豊橋, 2011.3.
    [paper] [slides]
    タイトルを見ると、何かとってもニッチなところを攻めている印象を与えますが、実際そうだから仕方がありません。人間の辞書登録から漏れた語彙をどうにかしましょうという話の一環です。アノテーションがないなら、教師なし単語分割をやればいいじゃないかという話になりますが、日本語の複雑な品詞をどうにもモデルに組み込みにくいという問題があります。品詞を考えず分割に専念するとしても、実際にはなかなか人間が思っているような分割を行ってくれません。そもそも変改しない単語が連続するというモデルの仮定がなりたっていません。変化しない語幹と変化する語尾をくっつけて一つの形態素とみなすというのが人間の方針なので。そこで、今回はこの仮定がなりたっている名詞の連続に専念しています。
  33. 村脇 有吾, 黒橋 禎夫.
    テキストから自動獲得した名詞の分類.
    言語処理学会 第16回年次大会, pp. 716-719, 東京, 2010.3.
    [paper] [errata] [slides]
    COLING2010 を参照してください。やっぱり PowerPoint を PDF 化すると数式が壊れます。誰か直しかたを知っていたら教えてください。
  34. 村脇 有吾, 黒橋 禎夫.
    オンライン語彙獲得を用いたリアルタイムウェブの言語処理.
    言語処理学会 第16回年次大会, pp. 551-554, 東京, 2010.3.
    [paper] [poster]
    単なるおもちゃですが、こういうこともできますよということで。Twitter に手を出したのは早い方だと思います。
  35. 村脇 有吾, 黒橋 禎夫.
    語彙獲得のための過分割未知語の検出.
    言語処理学会 第15回年次大会, pp. 324-327, 鳥取, 2009.3.
    [paper] [errata] [slides]
    草稿は、読み返すと誤字やら何やらで問題だらけでした。すみません。スライド側は修正版をもとに作っています。おまけスライドの数式の表示がバグっています。
    今回の発表の範囲ではありませんが、現状の未知語獲得システムは、獲得される未知語については、蓄積された用例を5-10個程度比較した時点で獲得を決めます。大抵の場合、この程度の数の用例で曖昧性解消に充分であり、逆に無闇にデータを増やすとかえって副作用があったりします。副作用としては、例えば、動詞「サチ-る」と名詞「サチ」(人名など) のように、語幹が共通だけど意味が異なる形態素が混在し、品詞識別が難しくなるという意図せぬ状態が生じたりします。このように一つの語幹が複数の品詞を想定すると、かなり多くの用例を集める必要がでてきます。雑多な内容のウェブページを集めてくると、こうした予期しない症状がしばしば発生します。単純にデータを増やせば幸せになれるとも限らないのではないかと最近考えています。
  36. 村脇 有吾, 黒橋 禎夫.
    形態論的制約を用いた未知語の自動獲得.
    言語処理学会 第14回年次大会, pp. 805-808, 東京, 2008.3.
    [paper] [slides]
    テキストから形態素解析器の辞書に足りない語彙を獲得して、直接解析器の辞書を更新。見切り発車で、内容はかなり混乱している。EMNLP2008 で改善したつもり。
  37. 村脇 有吾.
    マイナー言語に対する言語処理基盤開発 --キリル文字モンゴル語の場合--.
    第49回プログラミング・シンポジウム報告, pp. 141-148, 神奈川, 2008.1.
    未踏ユースの成果を報告したもの。単著。NLP 業界とは雰囲気が違う。いろいろ失敗。モンゴル語の処理は、そのうちきちんと整理したいと思いつつ、ずるずる引きのばしている。
  38. 村脇 有吾, 黒橋 禎夫.
    情報分析のための述語項構造を用いた動的オントロジー構築.
    言語処理学会 第13回年次大会, pp. 867-870, 滋賀, 2007.3.
    [paper]
    アイデア一発もの。KNP が格解析を行って述語項構造を出力するようになっているので、これをそのまま利用者に見せれば、単なるキーワードの羅列よりは内容が理解できるのではないかと考えた。実際には項に入る複合名詞の整理が大変だったり、問題山積みのまま研究テーマを変更。ちなみに、やっぱりこれはオントロジーではないと思っている。

Invited Talks

  1. 村脇 有吾.
    説明可能な人間としてのニューラルネットワーク: 対照研究の新手法.
    Joint Conference of the Technical Group of Thought and Language and Mental Architecture for Processing and Learning of Language (TL/MAPLL), online, 2021.9.
    [author manuscript] [paper] [conference site] [slides]
    基調講演。Neural Network as an Explainable Human: A New Approach to Contrastive Studies.
  2. 村脇 有吾.
    言語系統論への計算的アプローチの可能性.
    日本歴史言語学会2017年大会 公開シンポジウム 言語系統論の過去 (これまで) と未来 (これから), 吹田, 2017.12.
    [slides]
    done.
  3. 村脇 有吾.
    言語進化史の統計的研究.
    言語処理学会第22回年次大会 (NLP2016) チュートリアル, 仙台, 2016.3.
    [slides]
    done.
  4. 村脇 有吾.
    諸言語の歴史的変化に対する数理的取り組み.
    情報処理学会 第220回自然言語処理研究会 招待講演, 福岡, 2015.1.
    [slides]
    done.

Book Chapters

  1. 村脇 有吾.
    方言群の時空間動態の統計的モデル化に向けての予備的考察.
    木部 暢子, 林 由華, 衣畑 智秀編. フィールドと文献から見る日琉諸語の系統と歴史. pp. 163-187. 開拓社. 2021.9.
    [publisher's page]
  2. 村脇 有吾.
    言語系統論.
    金 明哲ほか編. 文化情報学事典. pp. 85-91. 勉誠出版. 2019.12.
    done.

Review Papers

  1. 村脇 有吾.
    学会記事: Latent Geographical Factors for Analyzing the Evolution of Dialects in Contact.
    自然言語処理, Vol. 28, No. 1, pp. 281-286. (2021.3).
    [J-STAGE]
    EMNLP2020 の論文の解説。
  2. 村脇 有吾.
    基本語順の歴史的変化の数理モデル.
    数学セミナー, 2020年3月号, pp. 36-40. (2020.3).
    [final draft]
    日本評論社の雑誌。Computational Linguistics (2019) と EMNLP (2018) の内容を一般向けに紹介したもの。田中久美子先生企画の「言語と数理」特集。
  3. 村脇 有吾.
    言語系統論への計算的アプローチの可能性.
    歴史言語学, 7, pp. 77-91. (2018.12).
    [amazon.co.jp]
    2017年12月のシンポジウムの発表を論文形式にしたもの。
  4. 村脇 有吾.
    言語変化と系統への統計的アプローチ.
    統計数理, 64(2), pp. 161-178. (2016.12).
    [abstract] [paper]
    特集「統計的言語研究の現在」の一部。2015 年 9 月の講演内容を土台にして執筆。書誌的には2016年12月発行となっているが、公開されたのは2017年3月3日。
  5. 村脇 有吾.
    言語系統解明のための計算的取り組み.
    人工知能, 31(6), pp. 780-786. (2016.11).
    [AI書庫] [author manuscript] [errata]
    特集「人工知能と歴史」の原稿。統計数理よりも後から依頼が来たけど先に出る。後から書いた分、頭の中の整理が進んでいる。
  6. 森 信介, 鍜治 伸裕, 村脇 有吾, 斉藤 いつみ.
    形態素解析 (特集: 自然言語処理技術の現状と展望: エラー分析プロジェクトを通して).
    情報処理, 57(2), pp. 10-11, (2015.12).
    [IPSJ]
    特集「自然言語処理技術の現状と展望 (エラー分析プロジェクトを通して)」。一部を分担。エラー分析プロジェクトは、呼ばれて参加してみたものの、やりたいことがエラー分析ではないことに途中で気付いてしまった。とはいえ次につながる収穫が得られたので全体として良かった。
  7. 村脇 有吾.
    研究会推薦博士論文速報: Automatic Acquisition of Japanese Unknown Morphemes.
    情報処理, 53(3), p.289, (2012.2).
    [IPSJ]
    研究会推薦なのに該当研究会で発表したことがなくて申し訳ない。

Talks (without Proceedings)

  1. 村脇 有吾.
    文字レベル言語モデルから単語レベル言語モデルへ: 上位存在に俺はなる!.
    第15回入力メソッドワークショップ (IM 2023), 京都, 2023.12.
    lightening talk.
  2. Yugo Murawaki.
    Toward Statistical Analysis of Spatio-Temporal Dynamics of Dialects.
    International Symposium and Workshop "Compiling GIS for Integrating Linguistic and Non-linguistic Information", Suita, Japan, 2023.9.
    [symposium program]
  3. 村脇 有吾.
    確率的言語モデルとステガノグラフィ.
    明和高校 数学夏の学校, 名古屋, 2023.8.
    [slides]
    高校からの依頼。
  4. 村脇 有吾.
    言語変化の数理.
    第24回京都大学情報学シンポジウム「文理融合の中核となる情報学」, 京都, 2023.2.
    [slides]
    研究科のイベント。
  5. 村脇 有吾.
    言語ステガノグラフィと分割曖昧性問題.
    第13回入力メソッドワークショップ (IM 2021), 京都, 2021.12.
    毎年恒例の。
  6. 村脇 有吾.
    方言群の分析のための分岐と伝播の統合的モデル化.
    シンポジウム「日琉諸方言系統論の展望」, online, 2020.12.
    [symposium site]
    国語研のイベントだが online 化。
  7. 坂田 亘, 田中 リベカ, 児玉 貴志, 新 隼人, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    知識に基づくニューラル対話基盤の構築.
    京都大学第14回 ICT イノベーション, 京都, 2020.2.
  8. Yugo Murawaki.
    Relaxing the Tree Constraint.
    Fijian Languages Symposium, Palmerston North, New Zealand, 2020.1.
    [symposium program]
  9. 村脇 有吾.
    統語的語の認定問題.
    Universal Dependencies シンポジウム, 立川, 2019.9.
    [slides] [symposium program]
    「言語資源活用ワークショップ2019」に埋め込まれている。
  10. Yugo Murawaki.
    Toward Spatio-Temporal Analysis of Dialects of Fijian.
    Fijian Languages, Maps and Beyond: An Interim Report of the Fijian Language GIS (Geographic Information System) Project, Suva, Fiji, 2019.3.
  11. 村脇 有吾.
    方言群の時空間解析にむけて: フィジー語を例に.
    新学術領域・ヤポネシアゲノム・言語班2018年度第2回研究集会, 石垣, 2019.2.
    [abstract] [slides]
    言語班代表の遠藤先生に誘われて。スライドに訂正あり。
  12. 村脇 有吾.
    潜在表現を用いた言語変化の通時的分析.
    京都大学第13回 ICT イノベーション, 京都, 2019.2.
    [abstract] [poster]
    お仕事。実際に使ったポスターから変更あり (1箇所誤字を修正)。
  13. 柴田 知秀, 坂田 亘, 田中 リベカ, 村脇 有吾 河原 大輔, 黒橋 禎夫.
    知識に基づく構造的言語処理の確立と知識インフラの構築.
    京都大学第13回 ICT イノベーション, 京都, 2019.2.
    [abstract]
    お仕事。
  14. Yugo Murawaki.
    Exploring Correlated Evolution with Latent Representations.
    University of Zürich, Zürich, Switzerland, 2018.3.
    [slides]
  15. 村脇 有吾.
    潜在表現に基づく言語構造の史的変化の分析.
    機構間連携・文理融合プロジェクト「言語における系統・変異・多様性とその数理」シンポジウム, 東京, 2018.2.
    [slides] [symposium site]
    at TKP東京駅大手町カンファレンスセンター.
  16. 村脇 有吾.
    Universal DependenciesとSyntactic Wordの闇. 第9回入力メソッドワークショップ (IM 2017), 京都, 2017.12.
    [lightning talk slides]
    毎年恒例の。
  17. 村脇 有吾.
    言語類型論の特徴からの潜在表現の獲得とその歴史的変化の分析への応用.
    機構間連携・文理融合プロジェクト「言語における系統・変異・多様性とその数理」研究発表会, 立川, 2017.12.
    [slides] [workshop site]
    国語研で。
  18. 村脇 有吾.
    言語の構造的特徴はなぜ、どのように変化するのか.
    NLP若手の会 (YANS) 第12回シンポジウム, 那覇, 2017.9.
    [booster] [poster]
    運営委員をやっていたけど空気を読まずに発表。今年で任期はおしまい。IJCNLP 2017 の話と今後の方向性。
  19. 村脇 有吾.
    語の認定とそれに付随する提案.
    UD Japanese 打ち合わせ, 京都, 2017.6.
    [slides]
  20. 村脇 有吾, 森 信介.
    単語分割とWikificationの同時解析.
    NLP若手の会 (YANS) 第11回シンポジウム, 白浜, 2016.8.
    運営委員をやっていたけど空気を読まずに発表。
  21. 村脇 有吾.
    言語変化と系統への統計的アプローチ.
    国立国語研究所・統計数理研究所 合同研究集会「統計的言語研究の現在」, 立川, 2015.9.
    [slides]
    予稿集なし。コーパス日本語学ワークショップ2015・サテライトシンポジウム http://www.ism.ac.jp/~daichi/workshop/2015-statling/ 後日『統計数理』に執筆予定。
  22. 村脇 有吾.
    類型論から統計的に日本語の系統を考える.
    名古屋地区NLPセミナー, 名古屋, 2015.5.
    予稿集なし。https://sites.google.com/site/nagoyanlpseminar/home
  23. 村脇 有吾.
    語彙拡散の空間構造モデル.
    統計数理研究所共同研究集会「社会物理学の現代的課題」, 立川, 2015.3.
    予稿集なし。
  24. 鍜治 伸裕, 森 信介, 高橋 文彦, 笹田 鉄朗, 斉藤 いつみ, 服部 圭吾, 村脇 有吾, 内海 慶.
    形態素解析のエラー分析.
    エラー分析ワークショップ (言語処理学会年次大会2015), 京都, 2015.3.
    実質的に何もしていないけど、次のネタを仕込む役には立った。
  25. 村脇 有吾, 黒橋 禎夫.
    テキスト解析を用いた講演における聞き手理解支援.
    京都大学 ICT イノベーション2013, 京都, 2013.2.
    [abstract]
    お仕事。
  26. 進 義治, 柴田 知秀, 村脇 有吾, 河原 大輔, 黒橋 禎夫.
    大規模語彙意味辞書に基づく実テキスト解析.
    京都大学 ICT イノベーション2013, 京都 (2013.2).
    [abstract]
    お仕事。
  27. Yugo Murawaki.
    Online Acquisition of Japanese Unknown Morphemes from Text.
    Second GCOE Kyoto-Berkeley Workshop, Kyoto (2010.3).
    専門外の人たち。日本語のテキストが読める人は少ないだろうと思っていたら誰もいなかった。いろいろ割切って発表。
  28. 村脇 有吾.
    自然言語の解析のためのテキストからの語彙の自動獲得.
    京都大学 ICT イノベーション2010, 京都 (2010.2).
    [abstract] [poster]
    企業の人などが来るということで、分野外の人への説明に気をつけてみる。思い切って中身の話をばっさり削ってみた。
  29. 村脇 有吾.
    オンライン未知語獲得.
    IM 飲み会2009, 京都 (2009.12).
    [slides]
    河原研のミーティングルームを借りて行われたもの。実は2002年からやっているそうだけど、私は初参加。参加者の目的が実用的なアプリケーションを作ることにある。学会とは違う感じで、それはそれで楽しい。
  30. 村脇 有吾.
    自律的な知識獲得に基づく自然言語の解析.
    GCOE 若手リーダーシップ養成プログラム 中間報告会 (2009.11).
    「GCOE 若手リーダーシップ養成プログラム」に採用されているので、その中間報告。発表10分、質疑応答5分。
  31. 村脇 有吾.
    形態素解析へのフィードバックのための未知語の自動獲得.
    情報学若手コロキアム 第7回 (2008.12).
    [slides]
    基本的に EMNLP2008 のネタ。情報学若手コロキアムは、大学の研究科の輪講みたいなもの。助教や上回の博士過程でまわしていたはずが、ネタぎれでまわってきた。時系列的な変化は、ポスターだと表現しにくいけど、スライドだとアニメーションのおかげでまだ説明しやすいことを再確認。
  32. 村脇 有吾.
    自然言語処理における知識獲得のためのクラスタ環境の利用.
    第2回 InTrigger Community Workshop, 東京 (2008.6).
    [slides]
    InTrigger は私が大規模計算に使わせていただいている計算機クラスタのクラスタ。報告の内容は、並列化やデータの管理など、研究よりもプログラムに関すること。果して役に立ったのか不安。
  33. 村脇 有吾.
    キリル文字モンゴル語形態素解析器の開発.
    2006年度下期未踏ユース成果報告会, 東京 (2007.8).
    誰に何を話せばよいのかよくわからないまま突撃して失敗。かなり反省。

Miscellaneous

  1. 知能情報メディア講座 言語メディア分野.
    言語ステガノグラフィ.
    cue, 第50号, p. 24, 2023.9.
    [PDF]
    京都大学電気関係教室技術情報誌。研究室名で出していて私の名前は記載されていない。
  2. 国立民族学博物館 特別展 Homō loquēns 「しゃべるヒト」ことばの不思議を科学する: ポスター研究展示.
    2022.09.01-2022.11.23.
  3. 言語学第二座談会 (後半の部).
    Yaponesian, 第2巻あき号, 2020.
    [article]
    文部科学省科学研究費補助金新学術領域研究「ゲノム配列を核としたヤポネシア人の起源と成立の解明」(領域略称名: ヤポネシアゲノム) の座談会。2020年1月千葉大学にて。
  4. 知能情報メディア講座 言語メディア分野 (黒橋研究室).
    言語の多様な構造的特徴に関する研究.
    cue, 第40号, p. 27, 2018.9.
    [PDF]
    京都大学電気関係教室技術情報誌。研究室名で出していて私の名前は記載されていない。
  5. 村脇 有吾.
    編集後記.
    自然言語処理, Vol.24, No.2, pp. 315-316, 2017.3.
    編集後記を書くということはその号の論文を全部読むということ。編集後記は J-STAGE では公開されないらしい。
  6. 村脇 有吾.
    新任スタッフの抱負.
    情報学広報, 第18号, p. 9, 2016.
    [PDF]
    京都大学大学院情報学研究科の広報。新任スタッフは寄稿を求められる。『情報学広報』は私の名前をよく「脇村」と間違える。
  7. 知能情報メディア講座 言語メディア分野(黒橋研究室).
    実テキスト解析をささえる語彙知識の自動獲得.
    cue, 第28号, p. 23, 2012.9.
    [PDF]
    京都大学電気関係教室技術情報誌。研究室名で出していて私の名前は記載されていない。
  8. 村脇 有吾.
    博士論文概要: Automatic Acquisition of Japanese Unknown Morphemes (日本語未知語の自動獲得).
    cue, 第27号, p. 48, 2012.3.
    [PDF]
    京都大学電気関係教室技術情報誌。
  9. 村脇 有吾.
    平成19年度修士論文テーマ紹介: 形態論的制約に基づく実テキストからの語彙の自動獲得.
    cue, 第20号, p. 41, 2008.9.
    [PDF]
    京都大学電気関係教室技術情報誌。

Research Grants (Principal Investigator)

Research Grants (Collaborator)

職歴?

暫定的にここに置く。 学会等: 担当授業等: