LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1164|回复: 6

关于转换xml文档为html文档

[复制链接]
发表于 2003-1-8 20:42:18 | 显示全部楼层 |阅读模式
大家在翻译好了以后,最好自己转换一下,这样可以知道格式是不是正确,要不然,如果格式问题太多了,最后一起转换的时候,会比较麻烦。
转换的方法,我刚试了,能直接转成gb2312编码的:
所需软件:
ftp://linuxsir:linuxsir@130.85.162.91/upload/xmlbook.tar
里面是docbook-4.1.2-newent.tar.bz2、docbook-dsssl-1.77.tar.gz、docbkx412.zip、openjade-1.3.1.tar.gz
安装方法在xml文档的INSTALL文件里有,我这里还是简单的说一下,有一点点区别:
1.在/usr/share下建立docbook目录,把docbkx412.zip解压在里面,这时候,在docbook目录里有一些文件和一个ent的目录,rm -rf ent,再把docbook-4.1.2-newent.tar.bz2解压到这个目录里。这时候,又会有一个ent目录,就对了。
2.在/usr/share下建立dsssl目录,把docbook-dsssl-1.77.tar.gz解压到里面,这时候,会有一个docbook-dsssl-1.77的子目录,把这个目录改名为docbook。
3.安装openjade,因为我以前装过openjade,所以这次我就采用硬路径的方法:
./configure --prefix=/usr/local \ --enable-default-catalog=/usr/share/docbook/docbook.cat:/usr/share/dsssl/docbook/catalog:/usr/share/dsssl/openjade/catalog &&
make &&
make install &&
cp -av dsssl /usr/share/dsssl/openjade
装好后,我为了直接转成gb2312编码的文档,把
/usr/share/dsssl/docbook/common/dbl10n.dsl的第63行:
(define %default-language% "en")
改成(define %default-language% "zh_CN")
现在就能转成gb2312文档了,我用来转的命令是:
mkdir -p htmlbook &&
cd htmlbook &&
mkdir -p introduction postlfs general connect basicnet server \
              content x kde gnome xsoft multimedia pst preface \
              appendices other &&
/usr/local/bin/openjade -t xml \
-d /usr/share/dsssl/docbook/html/blfs.dsl \
/usr/share/dsssl/docbook/dtds/decls/xml.dcl \
/home/tram/BLFS/BOOK/index.xml
大家只要把最后一行改改就行了。
还有,xml文件,用vi编辑也可以,我用gedit和vi编辑了文件,都能顺利转成html的中文编码文档。
发表于 2003-1-8 21:12:57 | 显示全部楼层

多谢tram!

什么时候开始搞linux的?
发表于 2003-1-8 21:36:39 | 显示全部楼层
大师!
今天犹豫要不要请tram兄出马搞掂转换,考虑到tram的实际情况,下午自己硬着头皮翻了INSTALL与README,想着明早就可以放上去,一看本贴,才知道自己白花时间。55555。
发表于 2003-1-8 22:09:16 | 显示全部楼层
呵呵。漂亮。
发表于 2003-1-9 01:13:48 | 显示全部楼层
复杂哦~
发表于 2003-1-9 09:01:50 | 显示全部楼层
tram,这个book你是怎么下载下来的。我看log里有HTTrack,是不是用它?
还有,为什么用xml格式,有什么优势吗?
 楼主| 发表于 2003-1-9 12:16:23 | 显示全部楼层
应该不会啊?html的是用httrack从blfs的网站上拖的,而这个xml的是用cvs从blfs的cvs服务器上拖的,用httrack我拖不回来
xml的优势啊:
1.一个内容绝不会出现两次,改一个地方,其他地方就会变了,因为其他地方都是用标记来引用的。这不仅减少工作量,也使第三点更容易。
2.不用搞格式,格式是dsssl里定义好的,每页整齐划一。连字体都是定义的,还有标记啊那些,都是定义了的,不会出现你用宋体,我用楷书的情况。
3.容易升级。新版的出了后,用diff看看哪些文件的哪些地方不一样,好改。而html因为是从xml生成的,生成时的dtd用得不同,生成的结果就不一样。比如现在按它的README里生成的html,和BLFS网站上的就不一样,在BLFS网站上的那个,每个头文件里都写明了是iso8859-1的,而自己生成的就没写。这些是因为生成时的dsssl里,它改了些东西。虽然效果是一样的,不过要用diff来比较的话,它就分不出来了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表