ja Gensim

Gensim
作者	Radim Řehůřek
開発元	RARE Technologies Ltd.
初版	2009
最新版	4.3.2 / 2022年12月21日 (23か月前)
リポジトリ	github.com/RaRe-Technologies/gensim
プログラミング; 言語	Python
対応OS	Linux, Windows, macOS
種別	情報検索
ライセンス	LGPL
公式サイト	radimrehurek.com/gensim/
	テンプレートを表示

Gensim（ジェンシム）は、最新の統計的機械学習を使用した、教師なしトピックモデリング（英語版）と自然言語処理のためのオープンソースライブラリである。

Gensimは、Python言語と性能向上を図るためにCython言語で記述されている。Gensimは、データストリーミングとインクリメンタルオンラインアルゴリズムを使用して大規模なテキストコレクションを処理するように設計されており、インメモリ処理のみを対象とした他の多くの機械学習ソフトウェアパッケージとの差別化を図っている^[要出典]。

主な機能

Gensimには、fastText（英語版）^[2]、word2vec、doc2vecアルゴリズムのストリーミング並列化実装に加えて^[3]、潜在意味解析（LSA、LSI、SVD）、非負行列分解（英語版）（NMF）、潜在ディリクレ配分（英語版）（LDA）、tf-idf、およびランダム射影（英語版）が含まれている^[4]。

Gensimの新しいオンラインアルゴリズムのいくつかは、Gensimの制作者であるRadim Řehůřekの2011年の博士論文『Scalability of Semantic Analysis in Natural Language Processing（自然言語処理における意味解析のスケーラビリティ）』にも掲載されている^[5]。

Gensimの使用例

Gensimは、2018年の時点で^[6]、医学から保険金請求分析、特許検索まで、さまざまな分野で1,400件を超える商用および学術用途で使用および引用されている^[7]。このソフトウェアは、いくつかの新しい記事、ポッドキャスト、インタビューでも取り上げられている^[8]^[9]^[10]。

無償および有償サポート

Gensimのソースコードは、GitHub^[11]で開発および公開されており、Google Groups^[12]とGitter（英語版）^[13]上でサポートフォーラムが公開・維持されている。

Gensimは、rare-technologies.com社によって商業的にサポートされている。学生インキュベータープログラムを通じて Gensimの学生メンターシップと学術論文プロジェクトも提供している^[14]。

脚注

^ “Release 4.3.2” (24 8月 2023). 18 9月 2023閲覧。
^ Scalable *2vec training
^ Deep learning with word2vec and Gensim
^ Radim Řehůřek and Petr Sojka (2010). Software framework for topic modelling with large corpora. Proc. LREC Workshop on New Challenges for NLP Frameworks
^ “Scalability of Semantic Analysis in Natural Language Processing” (2011年). 27 January 2015閲覧。 “my open-source gensim software package that accompanies this thesis”
^ Gensim academic citations
^ Commercial adopters of Gensim
^ Podcast.__init__ episode #71 on Gensim
^ Interview with Radim Řehůřek, creator of Gensim
^ “DecisionStats Interview Radim Řehůřek Gensim #python” (8 December 2015). 2022年1月22日閲覧。
^ Gensim source code on Github
^ Gensim mailing list on Google Groups
^ Gensim chat room on Gitter
^ Gensim open source Incubator

外部リンク

公式ウェブサイト

この項目は、ソフトウェアに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（PJ:コンピュータ/P:コンピュータ）。

[wikidata-6b5993c5fa109e96142230cbfaca98b971d29f24-v8-1] “Release 4.3.2” (24 8月 2023). 18 9月 2023閲覧。

[2] Scalable *2vec training

[3] Deep learning with word2vec and Gensim

[4] Radim Řehůřek and Petr Sojka (2010). Software framework for topic modelling with large corpora. Proc. LREC Workshop on New Challenges for NLP Frameworks

[5] “Scalability of Semantic Analysis in Natural Language Processing” (2011年). 27 January 2015閲覧。 “my open-source gensim software package that accompanies this thesis”

[6] Gensim academic citations

[7] Commercial adopters of Gensim

[8] Podcast.__init__ episode #71 on Gensim

[9] Interview with Radim Řehůřek, creator of Gensim

[10] “DecisionStats Interview Radim Řehůřek Gensim #python” (8 December 2015). 2022年1月22日閲覧。

[11] Gensim source code on Github

[12] Gensim mailing list on Google Groups

[13] Gensim chat room on Gitter

[14] Gensim open source Incubator

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]