Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
対話セッションテキストをセグメンテーションするシステム及び方法
Document Type and Number:
Japanese Patent JP7093292
Kind Code:
B2
Abstract:
Text segmentation has a long history going back to few of the earliest attempts. However, segmenting informal text has resulted in information loss with less accuracy. Embodiments of the present disclosure provide systems and methods for segmenting interactive session text that includes a plurality of input text posts using the information bottleneck method, augmented with sequential continuity constraints. Furthermore, the present disclosure and its embodiments utilize critical non-textual clues such as time between two consecutive posts and people mentions within the posts to reduce information loss. Using the fusion of all textual and non-textual information from the input text posts in the proposed information bottleneck approach for text segmentation allows to exploit non-textual information collectively with the text involved in the conversations to achieve better segmentation.

Inventors:
Vig, Robekesh
Yadaf, Mohit
Sundel, Vishal
Schloff, Gautam
Application Number:
JP2018220052A
Publication Date:
June 29, 2022
Filing Date:
November 26, 2018
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TATA Consultancy Services Limited
International Classes:
G06F40/131; G06F40/205
Domestic Patent References:
JP2017517830A
Other References:
西本 一志 外2名,発話の時間推移を考慮した自由対談文のセグメント分割手法 Segmentation of Transcribed Free Conversation Taking Utterance Dynamics into Account,情報処理学会論文誌,日本,社団法人情報処理学会,1998年 6月15日,第39巻第6号,p.1898-1914
小泉 実加 外2名,マイクロブログにおける文脈境界の検出,言語処理学会第22回年次大会 発表論文集 [online],日本,言語処理学会,2016年 2月29日,p.1089-1092
齋藤 正樹 外2名,テキストセグメンテーション手法を用いたマイクロブログポストの情報源推定,言語処理学会第20回年次大会 発表論文集 [online],日本,言語処理学会,2014年 3月10日,p.1095-1098
新谷 歩生 外2名,投稿間隔に基づくマイクロブログからの話題チャンク抽出に関する一検討,第3回データ工学と情報マネジメントに関するフォーラム 論文集 [online],日本,電子情報通信学会データ工学専門委員会,2011年 2月27日,Internet
Attorney, Agent or Firm:
Shin Shin