Skip to content

以「量化語言統計」為目的之簡化版漢文佛典 XML,由 CBETA XML P5 (https://github.com/cbeta-org/xml-p5.git) 經程式轉出。

Notifications You must be signed in to change notification settings

ddbc/CBETA_TAFxml

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Since 2019.08.12, The data in this repository has been migrated to DILA-edu/CBETA_TAFxml.

We will stop updating this repository from now. Please visit our new repository for the latest version of CBETA TAFxml.

CBETA_TAFxml

以「量化語言統計」為目的之簡化版漢文佛典 XML,由 CBETA XML P5 (https://github.com/cbeta-org/xml-p5.git) 經程式轉出。

專案主持人:洪振洲
轉換程式撰寫:周邦信
法鼓佛教學院

資料更新紀錄:

  • 2019.02.22 以當時最新 CBETA XMP P5,進行本資料集更新,並新增CBETA收錄之卍續藏(X)與嘉興藏(J)資料。

XML 資料格式簡介

標記 意義 使用規範
<ab> 用來紀錄文獻內的文字內容。
對映至原文獻之<p>(純散文)、
<lg>(韻文、偈頌) <p type="dharani">(咒語)。
對於卷的結構,僅改用
<ab type=”juan”>表示卷起始、結束之資訊
<ab type="prose"> 散文 </ab>(原<p>)
<ab type="verse"> 韻文</ab> (偈頌, 原 <lg>)
<ab type="dharani"> 咒語</ab>
(原<p type="dharani">)
<ab type="juan">佛說長阿含經卷第十七</ab>
(表示卷 起始、結束之資訊)
<body> TEI 文件內容容器 與原有CBETA XML、TEI P5 規範使用方式相同
<byline> 用保留譯者資訊 <byline>長安釋僧肇述</byline>
<div> 用以表示文獻結構,以type與level 屬性表示文件所屬型態與階層 <div type="fen" level="2"> 第二層div 結構,分</div>
<div type="pin " level="3"> 第三層div 結構,品</div>
<head> 置於各div 元素之下,紀錄各層次文字區塊之標題。 <head>(一)第一分初大本經第一</head>
<lb> 用以紀錄大正藏的行號資訊,以便作為原始資料之對應。 <lb n="0114b06" ed="T"/>

About

以「量化語言統計」為目的之簡化版漢文佛典 XML,由 CBETA XML P5 (https://github.com/cbeta-org/xml-p5.git) 經程式轉出。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages