Since 2019.08.12, The data in this repository has been migrated to DILA-edu/CBETA_TAFxml.
We will stop updating this repository from now. Please visit our new repository for the latest version of CBETA TAFxml.
以「量化語言統計」為目的之簡化版漢文佛典 XML,由 CBETA XML P5 (https://github.com/cbeta-org/xml-p5.git) 經程式轉出。
專案主持人:洪振洲
轉換程式撰寫:周邦信
法鼓佛教學院
資料更新紀錄:
- 2019.02.22 以當時最新 CBETA XMP P5,進行本資料集更新,並新增CBETA收錄之卍續藏(X)與嘉興藏(J)資料。
XML 資料格式簡介
標記 | 意義 | 使用規範 |
---|---|---|
<ab> | 用來紀錄文獻內的文字內容。 對映至原文獻之<p>(純散文)、 <lg>(韻文、偈頌) <p type="dharani">(咒語)。 對於卷的結構,僅改用 <ab type=”juan”>表示卷起始、結束之資訊 |
<ab type="prose"> 散文 </ab>(原<p>) <ab type="verse"> 韻文</ab> (偈頌, 原 <lg>) <ab type="dharani"> 咒語</ab> (原<p type="dharani">) <ab type="juan">佛說長阿含經卷第十七</ab> (表示卷 起始、結束之資訊) |
<body> | TEI 文件內容容器 | 與原有CBETA XML、TEI P5 規範使用方式相同 |
<byline> | 用保留譯者資訊 | <byline>長安釋僧肇述</byline> |
<div> | 用以表示文獻結構,以type與level 屬性表示文件所屬型態與階層 | <div type="fen" level="2"> 第二層div 結構,分</div> <div type="pin " level="3"> 第三層div 結構,品</div> |
<head> | 置於各div 元素之下,紀錄各層次文字區塊之標題。 | <head>(一)第一分初大本經第一</head> |
<lb> | 用以紀錄大正藏的行號資訊,以便作為原始資料之對應。 | <lb n="0114b06" ed="T"/> |