怎么将OWL转换成XML
protege生成的OWL格式可以选择存储格式,有个格式是***.rdf-xml.owl,但是这个不能直接用,在用推理机做推理的时候,可利用推理机转化为推理语言,这个过程完成后,知识文件就可以随心所欲的操作了.
如何将HTML文件转换成XML文件? 急!!!! 请说明具体步骤 谢谢!
html本身也是xml的,两者可以来回转换的,建议你去找一些xslt的资料看看.xslt是.NET里面专门用来转换xml的一个类.当然前提是你对.NET操作XML非常熟悉
如何将html转换成xml,跪求 请说明具体算法和用到的工具
我给你些我的建议吧
HTML的语法格式比XML宽松多了,真正XML格式的网页是XHTML,也就是下一代HTML,他的格式和XML差不多,很严谨的。
如果你不想利用某些HTML和XML互转工具,自己编的话,有一定难度。
1.HTML的节点可以没末节点,你需要不停扫描<,>,/,这三个符号以检查是否漏掉末节点,并补充。
2.HTML节点还可以不规则嵌套,你需要对已读入节点进行顺序存储,或用栈的数据结构来存储,并验证其层次正确性,最终正确顺序的节点,期间还得缓存节点值,或属性值。
3.HTML不同于XML,许多HTML节点有特殊的意义,许多HTML节点比如, 都需要经过特殊处理才行。 在技术上,为保证性能,还要在一下方面有加强。 1.强大的字符串扫描,和解析器,此工作也巨大,但网上源码很多,建议到google英文里搜索,HTML parser,XML parser(解析器),有很多c#,java,c++的源代码可以利用,没有强大的解析器,跟本无法读懂文件。 2.System.Xml空间的详细运用,除了简单的XMLWriter,还必须学会XMLDocument,XmlNode,能够动态操控XML。还有Xpath技术,操作XMl很有效率。 3.适当还会运用到正则表达式,来处理字符串匹配问题,尤其是节点的操作,即使是再好的字符串查找算法,有时也不如正则表达式,因此system.Text 中的Regex类要掌握好。 4.会控制WinForm中的WebBrower控件 当然,即使你不打算自己做,或已找到了源代码,要想读懂,也必须要以上的知识。 至于工具,网上有,源码还哪找,有java的,但下载不下来。 这是著名的W3C(Html,xml等技术的创始组织)的转换工具,里面也有一些介绍,相信会有用的。 有一个用C#编的转换器,但付费后才可看到源代码 还有一些软件,stylus的产品不错!
HTML转换成XML
HTML 是转不成XML的 HTML是网页标记语言 XML是一种数据格式 2个不是一种东西
如何将word转化为XML格式的文件
在WPS软件中打开word文档,然后另存为XML文件即可.具体操作请参照以下步骤. 1、在电脑上用wps软件打开目标word文件,进入主编辑界面. 2、然后点击软件左上角的WPS文字字样,会弹出一个下拉菜单. 3、接着在下拉菜单中依次点击选项“文件/另存为”. 4、然后会进入到保存的对话框中,在文件类型选项栏中选择“Word XML”的格式. 5、最后点击保存即可.完成以上设置后,即可将word文档转化为XML格式的文件.
Oracle中怎么把表结构转换成指定格式的XML文件
在oracle中提供了许多内置的程序包,它们用于扩展数据库的功能。在开发应用程序时,可以利用这些程序包。数据库用户sys拥有oracle提供的所有程序包。他们被定义为共有同义词,并将执行权限授予了public用户组,任何用户都可以访问它们。其中DBMS_XMLQUERY包用于将查询结果转换为XML格式,DBMS_LOB程序包包含雨处理大型对象的过程和函数。下面我们看一下DBMS_XMLQUERY和DBMS_LOB的用法:
SQL> DECLARE
result CLOB;
xmlstr VARCHAR2(32767);
line VARCHAR2(2000);
line_no INTEGER :=1;
BEGIN
result :=DBMS_XMLQUERY.getXml(‘select empno,empname from employee’);
xmlstr :=DBMS_LOB.SUBSTR(result,32767);
LOOP
EXIT WHEN xmlstr IS NULL;
line :=SUBSTR(xmlstr,1,INSTR(xmlstr,CHR(10)-1));
DBMS_OUTPUT.PUT_LINE(line_no || ‘:’ || line);
xmlstr :=SUBSTR(xmlstr,INSTR(xmlstr,CHR(10)+1));
line_no :=line_no + 1;
END LOOP;
END;
在上面的例子中我们声明了一个CLOB数据类型的result变量,以及VARCHAR2类型的xmlstr和line两个变量。其中,getXml函数用于将查询结果转换为XML格式,SUBSTR函数检索子字符串,32767值指定要从CLOB数据类型读取的最大字节数。检索到的字符串存储xmlstr变量中。LOOP块循环执行,每次从xmlstr中读取一行。INSTR函数返回一个字符串在另一个字符串首次出现的位置。在此,该函数返回换行符在字符串中的位置,直到遇到下一行。
大家觉得例子的结果能不能读出我们预期的结果呢?试试就知道了!!!
结果如下:
< ?xml version='1.0'?>
< ROWSET>
< ROW num="1">
< EMPNO>E001
< EMPNAME>Jane
< /ROW>
< EMPNO>E002
< EMPNAME>John
< /ROW>
< ROW num="3">
< EMPNO>E003
< EMPNAME>Joe
< /ROW>
< /ROWSET>
如何将word转化为XML格式的文件?
一、使用Jacob转换Word,Excel为HTML
“JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32 libraries。”
首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大
1、将压缩包解压后,Jacob.jar添加到Libraries中;
2、将Jacob.dll放至“WINDOWS\SYSTEM32”下面。
需要注意的是:
【使用IDE启动Web服务器时,系统读取不到Jacob.dll,例如用MyEclipse启动Tomcat,就需要将dll文件copy到MyEclipse安装目录的“jre\bin”下面。
一般系统没有加载到Jacob.dll文件时,报错信息为:“java.lang.UnsatisfiedLinkError: no jacob in java.library.path”】
新建类:
Java代码
public class JacobUtil
{
public static final int WORD_HTML = 8;
public static final int WORD_TXT = 7;
public static final int EXCEL_HTML = 44;
/**
* WORD转HTML
* @param docfile WORD文件全路径
* @param htmlfile 转换后HTML存放路径
*/
public static void wordToHtml(String docfile, String htmlfile)
{
ActiveXComponent app = new ActiveXComponent(“Word.Application”); // 启动word
try
{
app.setProperty(“Visible”, new Variant(false));
Dispatch docs = app.getProperty(“Documents”).toDispatch();
Dispatch doc = Dispatch.invoke(
docs,
“Open”,
Dispatch.Method,
new Object[] { docfile, new Variant(false),
new Variant(true) }, new int[1]).toDispatch();
Dispatch.invoke(doc, “SaveAs”, Dispatch.Method, new Object[] {
htmlfile, new Variant(WORD_HTML) }, new int[1]);
Variant f = new Variant(false);
Dispatch.call(doc, “Close”, f);
}
catch (Exception e)
{
e.printStackTrace();
}
finally
{
app.invoke(“Quit”, new Variant[] {});
}
}
/**
* EXCEL转HTML
* @param xlsfile EXCEL文件全路径
* @param htmlfile 转换后HTML存放路径
*/
public static void excelToHtml(String xlsfile, String htmlfile)
{
ActiveXComponent app = new ActiveXComponent(“Excel.Application”); // 启动word
try
{
app.setProperty(“Visible”, new Variant(false));
Dispatch excels = app.getProperty(“Workbooks”).toDispatch();
Dispatch excel = Dispatch.invoke(
excels,
“Open”,
Dispatch.Method,
new Object[] { xlsfile, new Variant(false),
new Variant(true) }, new int[1]).toDispatch();
Dispatch.invoke(excel, “SaveAs”, Dispatch.Method, new Object[] {
htmlfile, new Variant(EXCEL_HTML) }, new int[1]);
Variant f = new Variant(false);
Dispatch.call(excel, “Close”, f);
}
catch (Exception e)
{
e.printStackTrace();
}
finally
{
app.invoke(“Quit”, new Variant[] {});
}
}
}
当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = “C:\\AA”;
只指定到了文件夹一级,正确写法是String htmlfile = “C:\\AA\\xxx.html”;
到此WORD/EXCEL转换HTML就已经差不多了,相信大家应该很清楚了:)
二、使用XPDF将PDF转换为HTML
1、下载xpdf最新版本,地址: http://www.foolabs.com/xpdf/download.html
我下载的是xpdf-3.02pl2-win32.zip
2、下载中文支持包
我下载的是xpdf-chinese-simplified.tar.gz
3、下载pdftohtml支持包
地址: http://sourceforge.net/projects/pdftohtml/
我下载的是:pdftohtml-0.39-win32.tar.gz
4、解压调试
1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推;
2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录;
3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录;
4) 目录结构:
+—[X:\xpdf]
|——-各种转换用到的exe文件
|
|——-xpdfrc
|
+——[X:\xpdf\xpdf-chinese-simplified]
|
|
+——-很多转换时需要用到的字符文件
xpdfrc:此文件是用来声明转换字符集对应路径的文件
5) 修改xpdfrc文件(文件原名为sample-xpdfrc)
修改文件内容为:
Txt代码
#—– begin Chinese Simplified support package
cidToUnicode Adobe-GB1 xpdf-chinese-simplified\Adobe-GB1.cidToUnicode
unicodeMap ISO-2022-CN xpdf-chinese-simplified\ISO-2022-CN.unicodeMap
unicodeMap EUC-CN xpdf-chinese-simplified\EUC-CN.unicodeMap
unicodeMap GBK xpdf-chinese-simplified\GBK.unicodeMap
cMapDir Adobe-GB1 xpdf-chinese-simplified\CMap
toUnicodeDir xpdf-chinese-simplified\CMap
fontDir C:\WINDOWS\Fonts
displayCIDFontTT Adobe-GB1 C:\WINDOWS\Fonts\simhei.ttf
#—– end Chinese Simplified support package
6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格)
内容为:
Txt代码
@echo off
set folderPath=%1
set filePath=%2
cd /d %folderPath%
pdftohtml -enc GBK %filePath%
exit
7) 创建类
Java代码
public class ConvertPdf
{
private static String INPUT_PATH;
private static String PROJECT_PATH;
public static void convertToHtml(String file, String project)
{
INPUT_PATH = file;
PROJECT_PATH = project;
if(checkContentType()==0)
{
toHtml();
}
}
private static int checkContentType()
{
String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(“.”) + 1, INPUT_PATH.length())
.toLowerCase();
if (type.equals(“pdf”))
return 0;
else
return 9;
}
private static void toHtml()
{
if(new File(INPUT_PATH).isFile())
{
try
{
String cmd = “cmd /c start X:\\pdftohtml.bat \”” + PROJECT_PATH + “\” \”” + INPUT_PATH + “\””;
Runtime.getRuntime().exec(cmd);
}
catch (IOException e)
{
e.printStackTrace();
}
}
}
}
String cmd = “….”;此处代码是调用创建的bat文件进行转换
8) 测试转换
Java代码
public static void main(String[] args)
{
ConvertPdf.convertToHtml(“C:\\test.pdf”, “X:\\xpdf”);
}
怎么把word中转化为xml格式
将你的word文档打开,然后点击“另存为”在另存为页面的“保存类型”中找到“xml”点击保存就OK了
Oracle中的数据怎么转换成XML文档
首先你要把oracle的数据读出来,假设你的数据集名称为myds,表名为mydata,转换可以这样:
ds.tables[“mydata”].writexml(….),写入xml文件,如果你需要以指定的格式写,就用 writexmlschema()方法,如果你对xml熟悉,就用后者可以指定自己的格式。
补充一点:如果是用在asp.net中,要注意路径和权限的问题,客户端不能往服务器端写文件的。
怎样把wrod转换成XML的格式?
打开word-文件-另存为网页-选择xml文档格式.