作者:哥斯拉2502919771 | 来源:互联网 | 2023-08-28 13:12
图书馆数字化库存管理
印度的一种叫做Vachana sahitya的诗歌是流行的印度语Kannada的一部分 。 它于11世纪演变,并在12世纪盛行,是宗教Lingayatha运动的一部分 。 自那时以来,超过259名Vachana作家(称为Vachanakaru)已经编写了11,000多个Vachanas(经文)。
卡纳塔克邦政府将其中的21,000节经文数字化出版为15卷,称为Samagra Vachana Samputa 。 这些卷然后被变成一个独立的项目,叫做Vachana Sanchaya ; 该项目由两名Kannada语言学家Kannada Wikimedians和作者OL Nagabhushana Swamy共同承担,以丰富Kannada WikiSource 。 这个团队使用Unicode,这是将文本(和代码)转换为新格式的一致性标准。
斯瓦米(Swamy)试图查阅这些诗歌,但由于它位于 印度字符编码标准ISCII中 而遇到麻烦 。 我们开始 编写脚本以使Vachanas(诗歌)可以通过索引进行搜索。 但是,为了做到这一点,我们必须建立一个供所有人使用的平台:对研究这种文学感兴趣的语言研究人员,学生和广大公众。
Kannada Wikimedian的Omshivaprakash研究了平台的体系结构,确定了基础架构要求,并选择了要使用的开源软件工具。 我曾参与通过建议,反馈和质量保证为数字化提供重要的黑客手段和有价值的输入。
目前,我们的资料库Vachana Sanchaya拥有大约200,000个来自这些诗歌的独特单词。 公众一直在使用我们的存储库,并从我们的Facebook,Twitter和Google+个人资料中访问Va hanas(诗歌)。 现在有成千上万的人在日常工作中阅读梵文。 瓦查纳·桑恰亚(Vachana Sanchaya)不仅仅用于朗诵诗歌,还用于研究。 因此,我们为研究人员增加了一种方法来帮助我们审查内容,并将添加各种研究论文的参考资料。
最常用的单词是:
- ಕರ್ಮ ( 业力 :英语:工作/行为)
- ಸತ್ಯ ( Sathya英语:真实性)
- ನದಿ ( Nadī :英语:河)
ಆಂಗೀರಸ , ಪುಲಸ್ತ್ಯ , ಪುಲಹ , ಶಾಂತ , ದಕ್ಷ , ವಸಿಷ್ಠ , ವಾಮದೇವ , ನವಬ್ರಹ್ಮ , ಕೌಶಿಕ , ಶೌನಕ , ಸ್ವಯಂಭು , ಸ್ವಾರೋಚಿಷ , ಉತ್ತಮ , ತಾಮಸ , ರೈವತ , ಚಾಕ್ಷಷ , ವೈವಸ್ವತ , ಸೂರ್ಯಸಾವರ್ಣಿ , ಚಂದ್ರಸಾವರ್ಣಿ , ಬ್ರಹ್ಮಸಾವರ್ಣಿ , ಇಂದ್ರ ಸಾವರ್ಣಿ ಇವರು ಇಪ್ಪತ್ತು ಮಂದಿ ಪ್ರಪಂಚ ನಿರ್ಮಾಣ ಸಹಾಯ [ ದ ] ವರು . ಹತ್ತೊಂಬತ್ತು ಎಂದರೆ ಪುಣ್ಯನದಿಗಳು . ಅದು ಎಂತೆಂದಡೆ : ಗ್ರಂಥ |
当前,所有内容都可以通过OpenData API向公众提供,并且一旦审阅工作完成,它将通过WikiSource在公共领域中分发。 这将为学生,开发人员,研究人员以及对构建适用于卡纳达语和其他印度语言的语言工具感兴趣的任何人开放该系统。 用户将能够使用我们的代码对公共领域中可用的任何图书进行数字化。 各种语言的早期文献都受到人们的尊重,因此可以通过开放平台使用它,从而可以将内容重新用于研究,出版和其他文档工作。
我们鼓励其他此类项目遵循我们的方法并使用过程中任何有帮助的部分。
展望未来,我们希望:
- 如果更多研究有助于标记单词和发展词汇表,则启动自然语言处理(NLP)项目
- 继续为Sarvagnana Vachanagalu和DāsaSanchaya(工作已开始)以及Vyasa和Muddann(工作尚未开始)进行后续类似项目的工作
- 将该平台扩展到公共领域中可用的其他当代文学作品
由Pavithra Hanchagaiah和Omshivaprakash HI撰写。
由Subhashish Panigrahi编辑, CIS-A2K 。
翻译自: https://opensource.com/life/14/3/wikipedia-project-hindu-poetry
图书馆数字化库存管理