跳至正文

owl格式转xml,owl文件格式

怎么将OWL转换成XML

怎么将OWL转换成XML

protege生成的OWL格式可以选择存储格式,有个格式是***.rdf-xml.owl,但是这个不能直接用,在用推理机做推理的时候,可利用推理机转化为推理语言,这个过程完成后,知识文件就可以随心所欲的操作了.

如何将HTML文件转换成XML文件? 急!!!! 请说明具体步骤 谢谢!

如何将HTML文件转换成XML文件? 急!!!! 请说明具体步骤 谢谢!

html本身也是xml的,两者可以来回转换的,建议你去找一些xslt的资料看看.xslt是.NET里面专门用来转换xml的一个类.当然前提是你对.NET操作XML非常熟悉

如何将html转换成xml,跪求 请说明具体算法和用到的工具

如何将html转换成xml,跪求 请说明具体算法和用到的工具

我给你些我的建议吧

HTML的语法格式比XML宽松多了,真正XML格式的网页是XHTML,也就是下一代HTML,他的格式和XML差不多,很严谨的。

如果你不想利用某些HTML和XML互转工具,自己编的话,有一定难度。

1.HTML的节点可以没末节点,你需要不停扫描<,>,/,这三个符号以检查是否漏掉末节点,并补充。

2.HTML节点还可以不规则嵌套,你需要对已读入节点进行顺序存储,或用栈的数据结构来存储,并验证其层次正确性,最终正确顺序的节点,期间还得缓存节点值,或属性值。

3.HTML不同于XML,许多HTML节点有特殊的意义,许多HTML节点比如, 都需要经过特殊处理才行。 在技术上,为保证性能,还要在一下方面有加强。 1.强大的字符串扫描,和解析器,此工作也巨大,但网上源码很多,建议到google英文里搜索,HTML parser,XML parser(解析器),有很多c#,java,c++的源代码可以利用,没有强大的解析器,跟本无法读懂文件。 2.System.Xml空间的详细运用,除了简单的XMLWriter,还必须学会XMLDocument,XmlNode,能够动态操控XML。还有Xpath技术,操作XMl很有效率。 3.适当还会运用到正则表达式,来处理字符串匹配问题,尤其是节点的操作,即使是再好的字符串查找算法,有时也不如正则表达式,因此system.Text 中的Regex类要掌握好。 4.会控制WinForm中的WebBrower控件 当然,即使你不打算自己做,或已找到了源代码,要想读懂,也必须要以上的知识。 至于工具,网上有,源码还哪找,有java的,但下载不下来。 这是著名的W3C(Html,xml等技术的创始组织)的转换工具,里面也有一些介绍,相信会有用的。 有一个用C#编的转换器,但付费后才可看到源代码 还有一些软件,stylus的产品不错!

HTML转换成XML

HTML 是转不成XML的 HTML是网页标记语言 XML是一种数据格式 2个不是一种东西

如何将word转化为XML格式的文件

在WPS软件中打开word文档,然后另存为XML文件即可.具体操作请参照以下步骤. 1、在电脑上用wps软件打开目标word文件,进入主编辑界面. 2、然后点击软件左上角的WPS文字字样,会弹出一个下拉菜单. 3、接着在下拉菜单中依次点击选项“文件/另存为”. 4、然后会进入到保存的对话框中,在文件类型选项栏中选择“Word XML”的格式. 5、最后点击保存即可.完成以上设置后,即可将word文档转化为XML格式的文件.

Oracle中怎么把表结构转换成指定格式的XML文件

在oracle中提供了许多内置的程序包,它们用于扩展数据库的功能。在开发应用程序时,可以利用这些程序包。数据库用户sys拥有oracle提供的所有程序包。他们被定义为共有同义词,并将执行权限授予了public用户组,任何用户都可以访问它们。其中DBMS_XMLQUERY包用于将查询结果转换为XML格式,DBMS_LOB程序包包含雨处理大型对象的过程和函数。下面我们看一下DBMS_XMLQUERY和DBMS_LOB的用法:

SQL> DECLARE

result CLOB;

xmlstr VARCHAR2(32767);

line VARCHAR2(2000);

line_no INTEGER :=1;

BEGIN

result :=DBMS_XMLQUERY.getXml(‘select empno,empname from employee’);

xmlstr :=DBMS_LOB.SUBSTR(result,32767);

LOOP

EXIT WHEN xmlstr IS NULL;

line :=SUBSTR(xmlstr,1,INSTR(xmlstr,CHR(10)-1));

DBMS_OUTPUT.PUT_LINE(line_no || ‘:’ || line);

xmlstr :=SUBSTR(xmlstr,INSTR(xmlstr,CHR(10)+1));

line_no :=line_no + 1;

END LOOP;

END;

在上面的例子中我们声明了一个CLOB数据类型的result变量,以及VARCHAR2类型的xmlstr和line两个变量。其中,getXml函数用于将查询结果转换为XML格式,SUBSTR函数检索子字符串,32767值指定要从CLOB数据类型读取的最大字节数。检索到的字符串存储xmlstr变量中。LOOP块循环执行,每次从xmlstr中读取一行。INSTR函数返回一个字符串在另一个字符串首次出现的位置。在此,该函数返回换行符在字符串中的位置,直到遇到下一行。

大家觉得例子的结果能不能读出我们预期的结果呢?试试就知道了!!!

结果如下:

< ?xml version='1.0'?>

< ROWSET>

< ROW num="1">

< EMPNO>E001

< EMPNAME>Jane

< /ROW>

< EMPNO>E002

< EMPNAME>John

< /ROW>

< ROW num="3">

< EMPNO>E003

< EMPNAME>Joe

< /ROW>

< /ROWSET>

如何将word转化为XML格式的文件?

一、使用Jacob转换Word,Excel为HTML

“JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32 libraries。”

首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大

1、将压缩包解压后,Jacob.jar添加到Libraries中;

2、将Jacob.dll放至“WINDOWS\SYSTEM32”下面。

需要注意的是:

【使用IDE启动Web服务器时,系统读取不到Jacob.dll,例如用MyEclipse启动Tomcat,就需要将dll文件copy到MyEclipse安装目录的“jre\bin”下面。

一般系统没有加载到Jacob.dll文件时,报错信息为:“java.lang.UnsatisfiedLinkError: no jacob in java.library.path”】

新建类:

Java代码

public class JacobUtil

{

public static final int WORD_HTML = 8;

public static final int WORD_TXT = 7;

public static final int EXCEL_HTML = 44;

/**

* WORD转HTML

* @param docfile WORD文件全路径

* @param htmlfile 转换后HTML存放路径

*/

public static void wordToHtml(String docfile, String htmlfile)

{

ActiveXComponent app = new ActiveXComponent(“Word.Application”); // 启动word

try

{

app.setProperty(“Visible”, new Variant(false));

Dispatch docs = app.getProperty(“Documents”).toDispatch();

Dispatch doc = Dispatch.invoke(

docs,

“Open”,

Dispatch.Method,

new Object[] { docfile, new Variant(false),

new Variant(true) }, new int[1]).toDispatch();

Dispatch.invoke(doc, “SaveAs”, Dispatch.Method, new Object[] {

htmlfile, new Variant(WORD_HTML) }, new int[1]);

Variant f = new Variant(false);

Dispatch.call(doc, “Close”, f);

}

catch (Exception e)

{

e.printStackTrace();

}

finally

{

app.invoke(“Quit”, new Variant[] {});

}

}

/**

* EXCEL转HTML

* @param xlsfile EXCEL文件全路径

* @param htmlfile 转换后HTML存放路径

*/

public static void excelToHtml(String xlsfile, String htmlfile)

{

ActiveXComponent app = new ActiveXComponent(“Excel.Application”); // 启动word

try

{

app.setProperty(“Visible”, new Variant(false));

Dispatch excels = app.getProperty(“Workbooks”).toDispatch();

Dispatch excel = Dispatch.invoke(

excels,

“Open”,

Dispatch.Method,

new Object[] { xlsfile, new Variant(false),

new Variant(true) }, new int[1]).toDispatch();

Dispatch.invoke(excel, “SaveAs”, Dispatch.Method, new Object[] {

htmlfile, new Variant(EXCEL_HTML) }, new int[1]);

Variant f = new Variant(false);

Dispatch.call(excel, “Close”, f);

}

catch (Exception e)

{

e.printStackTrace();

}

finally

{

app.invoke(“Quit”, new Variant[] {});

}

}

}

当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = “C:\\AA”;

只指定到了文件夹一级,正确写法是String htmlfile = “C:\\AA\\xxx.html”;

到此WORD/EXCEL转换HTML就已经差不多了,相信大家应该很清楚了:)

二、使用XPDF将PDF转换为HTML

1、下载xpdf最新版本,地址: http://www.foolabs.com/xpdf/download.html

我下载的是xpdf-3.02pl2-win32.zip

2、下载中文支持包

我下载的是xpdf-chinese-simplified.tar.gz

3、下载pdftohtml支持包

地址: http://sourceforge.net/projects/pdftohtml/

我下载的是:pdftohtml-0.39-win32.tar.gz

4、解压调试

1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推;

2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录;

3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录;

4) 目录结构:

+—[X:\xpdf]

|——-各种转换用到的exe文件

|

|——-xpdfrc

|

+——[X:\xpdf\xpdf-chinese-simplified]

|

|

+——-很多转换时需要用到的字符文件

xpdfrc:此文件是用来声明转换字符集对应路径的文件

5) 修改xpdfrc文件(文件原名为sample-xpdfrc)

修改文件内容为:

Txt代码

#—– begin Chinese Simplified support package

cidToUnicode Adobe-GB1 xpdf-chinese-simplified\Adobe-GB1.cidToUnicode

unicodeMap ISO-2022-CN xpdf-chinese-simplified\ISO-2022-CN.unicodeMap

unicodeMap EUC-CN xpdf-chinese-simplified\EUC-CN.unicodeMap

unicodeMap GBK xpdf-chinese-simplified\GBK.unicodeMap

cMapDir Adobe-GB1 xpdf-chinese-simplified\CMap

toUnicodeDir xpdf-chinese-simplified\CMap

fontDir C:\WINDOWS\Fonts

displayCIDFontTT Adobe-GB1 C:\WINDOWS\Fonts\simhei.ttf

#—– end Chinese Simplified support package

6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格)

内容为:

Txt代码

@echo off

set folderPath=%1

set filePath=%2

cd /d %folderPath%

pdftohtml -enc GBK %filePath%

exit

7) 创建类

Java代码

public class ConvertPdf

{

private static String INPUT_PATH;

private static String PROJECT_PATH;

public static void convertToHtml(String file, String project)

{

INPUT_PATH = file;

PROJECT_PATH = project;

if(checkContentType()==0)

{

toHtml();

}

}

private static int checkContentType()

{

String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(“.”) + 1, INPUT_PATH.length())

.toLowerCase();

if (type.equals(“pdf”))

return 0;

else

return 9;

}

private static void toHtml()

{

if(new File(INPUT_PATH).isFile())

{

try

{

String cmd = “cmd /c start X:\\pdftohtml.bat \”” + PROJECT_PATH + “\” \”” + INPUT_PATH + “\””;

Runtime.getRuntime().exec(cmd);

}

catch (IOException e)

{

e.printStackTrace();

}

}

}

}

String cmd = “….”;此处代码是调用创建的bat文件进行转换

8) 测试转换

Java代码

public static void main(String[] args)

{

ConvertPdf.convertToHtml(“C:\\test.pdf”, “X:\\xpdf”);

}

怎么把word中转化为xml格式

将你的word文档打开,然后点击“另存为”在另存为页面的“保存类型”中找到“xml”点击保存就OK了

Oracle中的数据怎么转换成XML文档

首先你要把oracle的数据读出来,假设你的数据集名称为myds,表名为mydata,转换可以这样:

ds.tables[“mydata”].writexml(….),写入xml文件,如果你需要以指定的格式写,就用 writexmlschema()方法,如果你对xml熟悉,就用后者可以指定自己的格式。

补充一点:如果是用在asp.net中,要注意路径和权限的问题,客户端不能往服务器端写文件的。

怎样把wrod转换成XML的格式?

打开word-文件-另存为网页-选择xml文档格式.