文件SQL Server全文检索的正确查询Word文件下载.docx
《文件SQL Server全文检索的正确查询Word文件下载.docx》由会员分享,可在线阅读,更多相关《文件SQL Server全文检索的正确查询Word文件下载.docx(10页珍藏版)》请在冰豆网上搜索。
完成创建后启动索引服务
(1)启动索引服务
(2)索引服务启动成功后索引编录的信息,可以看到编录信息就表示服务已经启动成功。
将索引服务和SQL数据库关联:
在SQL查询分析器(SQLQueryAnalyer)里执行下面的存储过程
EXECsp_addlinkedserverDcs,--连接服务器的名字,到后面查询的时候要用到
'
IndexServer'
MSIDXS'
DCSII'
--索引服务里新建的编录名字
索引服务的性能调整方法1
(1)右键选择索引服务
(2)选择AllTasks->
TunePerrformance
(3)选择用户自定义
(4)点击Customize进入性能调整窗体
(5)将Index和Querying的属性移动到最右边
(6)点确定完成操作
性能调整方法2
如果服务器不需要对整个系统的文件进行索引,可以停止或者删除System编录。
MSSQL对索引服务器的调用
1.通过sql语句查询连接服务器的内容
SELECTQ.*
FROMOpenQuery(dcs,--连接服务器名字
SELECTFileName,Size,DocAuthor,path--在连接服务器里的sql语句
FROMSCOPE()
WHERECONTAINS('
'
番号andabc'
)'
)ASQ
2.因为SQL语句不支持动态输入的字符串,因此查询字符串只好在C#代码里进行拼接
实不用将文件保存到数据库外面也能实现在数据库里实现全文搜索。
具体方案是在SQLServer2000里安全全文搜索功能,用image字段存储文件内容,并新增一个字段存放文件类型,然后在通过企业管理器新建全文索引项的时候将这两个字段匹配就可以。
不过从数据库的/率以及今后数据库备份和恢复的效率上来看,将文件放在数据库的设计不是太好。
以上的相关内容就是对SQLServer全文检索的查询的介绍,望你能有所收获。
结合SQLServer全文检索对Word内容进行检索的三个方案
分类:
UtilitySQLServer2008Tips推荐2011-04-2123:
071454人阅读评论
(1)收藏举报
导读:
除了利用office提供的API对word文档内容进行检索外,本文简要总结如何结合SQLServer的全文检索技术对Word文件的内容进行检索的三个方案。
一、结合Windows索引服务进行全文检索
方案摘要:
1.改变文件存储时的文件名;
2.配置索引服务器,并将索引服务器与MSSQLServer关联。
3.修改SQL语句,将进行全文查询语句的内容加入查询条件中
一个详细的实例,参考这里:
优点:
可以独立对文件以目录方式物理存放,并且这些文件继续以doc格式存放。
缺点:
只能读取,不能写入。
二、结合BLOB数据进行全文检索
将doc文件以BLOB数据格式varbinary(max)存放于数据库的表中,再对表进行全文检索。
这是最为常见的一种方案了。
一个简单插入表的示例:
[ruby]viewplaincopyprint?
1.-------二进制文件查询示例
2./*********************3w@****************/
3.Use
Master
4.Go
5.IF
EXISTS
(SELECT
name
FROM
sys.databases
WHERE
=
N'
BlobDataDemoDB'
)
6.DROP
DATABASE
BlobDataDemoDB
7.GO
8.USE
9.GO
10.CREATE
11.GO
12.--------启用全文检索
13./*********************3w@****************/
14.execute
sp_fulltext_database
enable'
15.go
16.use
blobDataDemoDB
17.GO
18.--创建一个包含BlOB列的表
19./*********************3w@****************/
20.if
OBJECT_ID('
SampleBlobTable'
is
not
null
21.drop
table
SampleBlobTable
22.go
23.CREATE
TABLE
24.(
25.[PKID]
int
identity(1,1)
primary
key,
26.[FileType]
Nvarchar(32)
null,
27.[FileName]
Nvarchar(255)
28.[FileContent]
VARBINARY(MAX)
NULL,
29.[AddTime]
datetime
default(getdate())
30.)
31.GO
32.IF
*
sys.objects
object_id
OBJECT_ID(N'
[dbo].[CPP_InsertOneBlobDataToTable]'
AND
type
in
(N'
P'
PC'
))
33.DROP
PROCEDURE
[dbo].[CPP_InsertOneBlobDataToTable]
34.GO
35.--创建一个插入数据到SQL
server的存储过程
36./*********************3w@****************/
37.CREATE
CPP_InsertOneBlobDataToTable
38.(
@FileType
nvarchar(32),
39.@FileName
nvarchar(255),
40.@FileContent
41.)
42.AS
43.INSERT
SampleBlobTable([FileType],[FileName],[FileContent],[AddTime])
44.VALUES
(@FileType,@Filename,@FileContent,getdate())
45.GO
[c-sharp]viewplaincopyprint?
1.using
System;
2.using
System.Collections.Generic;
3.using
System.Linq;
4.using
System.Text;
5.using
System.IO;
6.using
System.Data.SqlClient;
7.using
System.Data;
8.namespace
BlobDataSearchDemo
9.{
10.
class
Program
11.
{
12.
const
string
conn
@"
Server=ap4/Agronet09;
DataBase=BlobDataDemoDB;
uid=sa;
pwd=as;
"
;
13.
static
void
Main(string[]
args)
14.
15.
SaveDoc2SQLServer(@"
D:
/2008Data/StreamData/Doc/轻舞飞扬.doc"
conn);
16.
/2008Data/StreamData/Doc/天龙八部.doc"
17.
/2008Data/StreamData/Doc/English.doc"
18.
Console.ReadKey();
19.
}
20.
private
SaveDoc2SQLServer(string
filepath,
conn)
21.
22.
FileInfo
fi
new
FileInfo(filepath);
23.
if
(fi.Exists)
24.
25.
//Open
the
stream
and
read
it
back.
26.
using
(FileStream
fs
File.OpenRead(filepath))
27.
28.
byte[]
b
byte[fi.Length];
29.
SqlConnection
Conn;
30.
SqlCommand
cmdUploadDoc;
31.
UTF8Encoding
temp
UTF8Encoding(true);
32.
while
(fs.Read(b,
0,
b.Length)
>
0)
33.
34.
Conn
SqlConnection(conn);
35.
//Setting
36.
cmdUploadDoc
SqlCommand("
CPP_InsertOneBlobDataToTable"
Conn);
37.
cmdUploadDoc.CommandType
CommandType.StoredProcedure;
38.
cmdUploadDoc.Parameters.Add("
@FileName"
SqlDbType.NVarChar,
200).Value
fi.Name;
39.
@FileContent"
SqlDbType.VarBinary,
0).Value
=b;
40.
@FileType"
32).Value
fi.Extension.Replace("
."
"
);
41.
Conn.Open();
42.
cmdUploadDoc.ExecuteNonQuery();
43.
Conn.Close();
44.
45.
46.
47.
48.
49.}
查询结果:
注意:
1、在数据库设置全文检索时,必须有一个字段是文档类型,SQLServer全文检索依据此文档类型启动相应的doc引擎进行检索。
2、必须设置全文检索的语言,中文为2052,英文为1033。
将doc文件导入SQLServer数据库中,可以方便地进行读取和全文检索,必要时也可以写入。
varbinary(Max)受2G大小限制,而且数据库存入大量的BLOB数据,将变得异常臃肿,检索速度将大大降低。
三、结合FileStream进行全文检索
与方案二类似,只不过利用FileStream技术将doc文件以数据格式varbinary(max)存放于数据库外的物理文件中,再对表进行全文检索。
在SQLServer2008中
–FILESTREAM数据不支持远程存储
–不支持数据库快照和数据库镜像
–某些Katmai的功能不支持FILESTREAM,例如:
•SQL加密
•表值参数
前提:
必须安装全文检索并启用FileStream
参考:
将doc文件导入SQLServer数据库中,可以方便地进行读取和全文检索,必要时也可以写入,并且克服了方案二的缺点。
varbinary(Max)字段只存放索引,而实际的内容存放于数据库外,大小只受NTFS文件夹物理大小的限制。
小结:
本文简要总结如何结合SQLServer的全文检索技术对Word文件的内容进行检索的三个方案。
本人认为方案一和方案三均可行。
欢迎交流。
3w@