DeepSeek+DeepResearch

让科研像聊天一样简单


北京航空航天大学 高研院 助理教授 清华大学新闻学院与人工智能学院双聘教授 沈阳团队博士后

何静



队自研DeepResearch 软件免费公测


通过百度网盘分享的文件: AI学术工具公测版.exe


链接: https: //pan. baidu. com/s/1 kPrFGhpWuwB2eiGuP33Qjg?pwd=041 7 提取码: 041 7




Al综述全版本

免费使用




能做什么?

要怎么做?

效果如何?


^{故什么?


本质: 以多agent实现从数据采集到可视全流程


数据采集


通过编写爬虫代码 、访问数据库 、读取文件 、调用API等方式,采 集社交媒体数据 、数据库内容 、文本数据 、接口数据等 。


数据处理


AIGC 数据应用


数据分析


通过数据清洗 、数据集成 、数据变换 、特征工程等方式, 实 现数据纠错 、数据整合 、格式转换 、特征提取等 。

对数据进行诊断 、预测 、关联 、聚类分析, 常用于问题 定位 、需求预测 、推荐系统 、异常检测等 。


数据挖掘


数据可视化


对数据进行分类 、社交网络分析或时序模式挖掘, 常用 于客户细分 、信用评分 、社交媒体营销 、股价预测等 。

将数据转化为统计图 、热力图 、网络关系图 、词云 、树形 图等,用于揭示数据中蕴含的模式 、趋势 、异常和洞见 。


模型特点






DeepSeek R1

□高效推理: 专注于低延迟和 高吞吐量,适合实时应用。

□轻量化设计:模型结构优化, 资源占用少, 适合边缘设备 和移动端。

□多任务支持:支持多种任务, 如文本生成 、分类和问答。


Open AI o3 mini


Claude

3.5 sonnet


□小型化设计:轻量级模型, 适合资源有限的环境。

□快速响应:优化推理速度, 适合实时交互场景。

□通用性强 :适用于多种自 然语言处理任务 ,如对话 生成和文本理解。


□平衡性能:在模型大小和 性能之间取得平衡 ,适合 中等规模任务。

□多模态支持 :支持文本和 图像处理,扩展应用场景。

□可解释性 :注重模型输出 的可解释性和透明性。


Kimi k1.5

□垂直领域优化 :针对特定领域 (如医疗 、法律) 进行优化, 提供高精度结果。

□长文本处理 :擅长处理长文本 和复杂文档,适合专业场景。

□定制化能力:支持用户自定义 训练和微调,适应特定需求。


爬虫数据采集


提示词


任务



1 、阅读网页源代码,提取特定网页内容;

2 、撰写python脚本;

3 、提取并合并网址;

4 、提取网址内容;

5 、写入文件。


你需要完成以下两个任务:

1. 阅读网页【网址】 源代码【对应网页源代码】 。提取所 有包含“春运2025 XX日, 全社会跨区域人员流动量完 成X万人次 ”的网址进行去重 、筛选, 合并成网址列表

2.撰写python脚本, 基于步骤1输出的网址列表提取所有网 址内容“截至目前 2025 年春运( 2025114日到28日) 相关数据(如日期 、全社会跨区域人员流动量 、铁路客运 量 、公路人员流动量 、水路客运量 、 民航客运量等) ”完 成数据提取并写入文件“2025春运数据.txt


牙我写的9m齢.决取而阳施ws.lua&MkMWzhMWm网站中的标遇和賃接

用我写冲8危虫,■取httpenews,buaaediλ6⅛>J)W,2π司站中CfesklislIloP auto,下山药标 强福接

旬我写Pythg蘇,总恥世幽掘恤山≡3'Mu∙Wwggj)w,htm河站中CiasHlistteftlDp autcΓ F由引所 自标題噺

(m«? UTF∙δ)

在勲髄•个eg文啓,m*»⅛⅛nħ+

⅛fTS→≡.诵代取毎一伯接的内私牌翩.毗啲丽I咄中

对干毎•个鞋撓旗黑取毎 伸接中dass=∙vje*sjxhtenr白内乱并保存到excelJi列呢Xr


DeepSeek R1 能够提取所有网址并进行 筛选 、去重 , 所撰写代码 运行后完成数据爬虫任务, 所获取数据准确 , 少量数 据有所遗漏 。


E∙,XltEEYΛS**∙5QLm∙{a5.iAΛdUUM5U).


RlI?*. 21W.8 2t2⅛<j *%21<nS" M29-42-M,3U7S.L


”1 4.,”,?”•》 α<⅛. ι..J∙.3,iir.W lS14rrll.4.241.M


£2:;SS規胱学n


2β29-42-U, 3387t.2 2« J2,mW∙? 2«» «j ∙L, J1O∙.1


3Ma.4.,2J2.ar24i MW.i.,J413. J*J.W

lλβ,.W⅜.y.M8,/


2«2!-4-SL, JM∙4,1LI3.2,, 14]rZS].Bl


wmeme 2«2S-« M.^eMt.6 3>2⅞-4<-2a,3M].9


M?.4..m.«JM.»

5Sl.ir.M.*.2∙5.9⅝ 7Λ,,sβ.7rr-∙—


.IM-23


X⅛落:駕鳳;僚:娯喝


3>23-41-2Sl3T3Ll.a, N2If,2" j Xii ∙ι ∕j.j⅛¾jj⅛, 2US-43-S,3WS.⅝, MJWI-M.3M54-1, X 心―d.6, 3KS-βl-l⅞,J14Ll.B, MI5→-lβ.JW7).4, N3, V 1.',JH<J t. 2∙25-42-lβtlBTa3.X,



3SM.J,,M.al]4∙.4fr J<3O.>..n,β,2¼.∙4 1M4Λ. J4.⅛,2^.51 »12. J., ?».4,1X3.11 3)13.1.,73.4.J3β.41 1.M2.2M.4B IJn.],, 73,234.43 lU4r4,,W.q,3J4.∙⅝ 323e.)..&».?.2n.M 33B2.fr.,M.7,231.13 J1H.1,,O∙>,2)9.> 3e>j,.⅛3. j.2*∙.ιa


r*tjn UrleIftfo

• VfttVYIRBK

□r∙f fetcħ.detail.daτaIurlwinfo :

for url. data in urVai<ιfo.Itois : Iryi

r∙*pont∙ r∙qu∙(ts.9∙turl, header*-h∙⅜d∙rs, thMθut lβ

response.encodIng -j?f-8" content ∙ response.text soup - Beautitul5oupι content, "ht®I.parser*' !∙ t<Mt SQUPJt∙xt,,

patterns - <

-railway- L'H∙*⅛ls∙H%.卜八"乃人K.

"nighΛi∕*: L4>∙人员Wg( I*dJ 八*万内・,

-w≡τ∙Mγ∙:「“水終Eif\”H\%\.八”方人3T, -∙vi≡tloβ-: ry*iltB3 [<>,.H)s*ZiAΛ∙

for keyl pattern in patterns.!teas> rutch r∙.s>arcħ p∙tttrnr text if utcħ:

data key I - utch.group ɪl. re9lacel* `, "I

except Exception as el

prɪnt(f' Ψlft {url⅛ *tt: ∙Λtre return urt.lofo

~t∙f sa,Λ,∙D-.e data, filename

tc DpenlfilenaM, ,w", encoding "at«-B' I。: f:

LwTito日%i?n#l»R«AS U方■ : 九人次),佚母喜产■‹万人加),上AUSbg■ i万人;Λ) .水施Ifr■《万 ΛΛ L 函再=■ <万人M >n-1

* jγ Itea in data.v-alues

Line - f"{xtcα I' date ` ^. f Itea 'total' ,.Tteii raltw^F' ,1 ɪteɑ 'highway' ]) > ' ɪten I 'wιterwy' }J ιtβ≡l 'aviation* ¼n,

f. writelU11e)                                                                   ▼



Open AI o3mini

响应速度快 , 能够高效提 取所有需求链接 , 输出完 整可运行python脚本, 代 码运行后生成文件 , 但数 据采集结果为空 。


2OM∙ttMfl-a3-txt


B«  全社WqMAml   «»■£■ iAAJJUsS NH

∙A2VA2lteE KttaM<ΛJIJteMI    天    夫    灸    芟

∙a2∙a2NΓB. *4HEUMA•工∙M    ft    λ    Jt    λ

∙atM2NR TMWMW  Klt 常,

∙3M2"⅜B ⅞-tLM*α<λJlAiMI    无    天    天    关

∙⅛2*S2ME. gua∙fi∙AJiωβ    无    天    天    天

∙ltM23 2R2B ∙4t∙Ml■人3*IM    X    X    X    Jt

*«M» LipiR t⅞^fn*Λ.XMf   Λ    Λ    Λ    Λ

m»» tn)∙E x<πea∙Λ!uu∙   五   无   羌   关

∙*sm l*3β!. AtttftaeAJlXaM    五    乞    芟    王

∙*MS IRZVB. ∙<HMKMA∙∙M   爱   気   土   更

∙tt2∙n IRΛR t<tWW<AJΛU∙    ⅞    a    Λ    Λ

∙∙NCim∙B. ttttfM<A.«2U0a   ⅞    ⅞    Λ    A

∙⅛MaιA2ze. iktHia*a*A.iAMi    λ    ⅛    ⅛    ⅛

• AMa IHZlD 升―DKΛN3HM  XXXX

∙%MMl⅜MP ttt⅜Hβ<AaaMI    %    λ    ⅞    Λ

•dK» lDt4B ttltM*AJjUM>   «    ⅞    ⅞    ⅞

•ana ifkiab. ttt⅜M*zdiJbM   *   去*   大

∙*M2⅞ IRlTC. f*tiN|Ot*.S|l*M    *    *     X     *

• CM?$ IWMF flTMHA,Jw•   Λ    A    X    A

SANZStIttSE. tttft*α<AJJImM    五    无    天    夫

•3» IKMB. VttMVUtMdtlMI   欠   大   大*

■a(n own ttT*rmo∙:■在■吃γ∏e▲項-«1|■■-。■,."*(


"http*ι"ww,wt.gαγ,cMx**MRt"2 625Eunyur√cMnrj!Ulιuju∕ien∙Zyt2⅞2 54 (yan **ħttμkt∕∕M⅛M,a∙t.9<>Y>tn∕∕fu**>i i∕2U⅞L!tufrfUt√ Cfunyunthu ju<jt∕⅞tJ∕ I M25A?<6_4l&i?b4 ,*http∙i∕∕MM.*vi.9θv.th∕r⅝ant L∕7l23r¼uvrr∙∏^c*M∏*mπshijuΛ2∙7,5l2yt2t2S42∙S.41U714 ChrtPGt/7 *mw.81.g*.cru*ιħM∙WtL∕2t2S0u",uf√cZn*vrιsnuju∕2βZ5d2*f5A2∙4-4tM64X ,∙htip∙!∕∕tΛ**.wt.9<nr.c*√z>M∙∙tl√2W5c*Mf7ur√r*<M∏ruπwħu)urj∙Λ∙7∕WW5*7∙3J161βU -https I ~. Mt.go*.c√tfu∙MV2e2Scnunyurt∕ctunvυnsnuju∕2C2SβZ∕t2*2M2∙2.41D5Tl "ht tp“ //mm.wt-qov. rι√,ħu∙*t "2*l5eufημιr√cfu"wmhu]u∕J∙H∙)∕1 M7⅞*7*l. 41M⅝U ,ahttpιι∕∕MM.a*t.gσv.c√rHiM>tV2n5churτrun∕cħwn^nshuju∕7αnβυt24 2 5413I.41634 92 **httpkt//M*.afrt. ⅞tttf tCA∕IhuMti∕2*2S Ui ur<yUft∕Cfιutιχutiklιuju∕Jt½t2∕ti*2S413M-4tfc3∙4¼ '4httpi^∕wVtWt1)9WrCτ√r**ιw*t L∕2V73Euv*yun∕ CZnenlnII]MCneI/174 2 34119-416JMAI "https"/WWt3LcWa0tl√262Sch5v tιr√cftungMw]u/MZStIMX?5128_4L33»S "http”//1.wt∙9⅛v.rr√r*M∙M U2∙Λ∙*urηruf√c*Mn>υ∏∙huju∕>∙Λ∙1?t»?MlJ? JlftJJM '*https∕∕MV.∙*t.fliw.cr√mi∙f<tL∕2a2Sthunyur√cfM∏rtutιu}u∕2∙23∙Vt2*25412⅞.4LD2B4 nhttftt∕∕www,*M.⅞α*.c<√∕tlu*tl M^t?⅞Llιufrvur√e>Mnfuns!tu)uZ9t^Stl^i2*2Ml½^41fc>21• "http JI //ww»wt-.gov. cr√rhu∙∙t Lf2(25d>uπyun∕chu∏κυπι∏uju∕7∙7}∙l∕t2*7MI74-4mi3∙ *,tιttpti∕∕ΛM.Mt.⅞u*.e⅛∕xhu∙etx∕2a2SUU4rr*un∕ctun*unihuju∕2tHtl∕tM2MlU.4LUlH

1 Jtt<-+∙ftNKHW Fi∙∙

⅛f -'      , ∙■ IurUt

r∙,βAM* - r*φrtit⅛.4*t(urll

rw<>β⅞e.encglng -∙ -'    tfillViV-∏∙ τ-∙

soup - Beautlf«lSaup(respMfre.text, ^   .    ••丿

CQIVtvat : ∙<oup.find' |   .八“一 I∙ ! ∙      >

if co∙teκtι

cαrt∙ht. φal.t∙at ∙trip- > I

elιei


α^M∏('. .,r √''v , ∙.∙ ,   - , enp*di«9* I ■ ∙ I 一. 〃“:

for url l∏ VTlSI

tuι∙ - SitectquiuE

* d∙t∙:

fil*.wrlt«l4aiB ♦     ∙ }

file.wrltel ∙, ∙ -,     . , ■ ", ,^ ,^ f *     ,〕「»

>ri∙t I * BMUOEfi. B*98 ,2US∙BttB.tι 'I


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


爬虫数据采集



结论


□ 目前DeepSeek R1 Open AI o3mini Kimi k1.5支持联网查询网址 ,Claude 3.5 sonnet暂不支持;

口 四个模型均能根据上传的网页代码,对多个网址链接进行筛选 、去重 ,完全提取出符合指令要求的所有网址链接并形成列表;

□在复杂爬虫任务上,DeepSeek R1Open AI o3min生成的代码均能正常执行数据采集任务 ,o3响应速度更快,R1数据采集结果更加完 整准确;其他2个模型都存在多次调试但代码仍然运行不成功的问题,如代码中罗列URL不全 、输出文本中提取数据为空等。


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


文件数据读取


?^^..望.嘴W 2 05—:11r 提示词


任务


1 、读取文件;

2 、根据指定内容整理成表格。


所上传的“2025春运数据( 114-28日) .txt ”包含了从2025114日至202528日每天各种交通方式的春运客运 量信息, 请从中读取每一天的信息, 并整理成一张表格, 要求包括以下几项信息: 1.当天日期; 2.当天的铁路客运量 、 比2024年同期多或者少的百分比 、环比的百分比 。3.当天的公路客运量 、 比2024年同期多或者少的百分比 、环比的百分 比 。4.当天的民航客运量 、 比2024年同期多或者少的百分比 、环比的百分比。


DeepSeek R1

能够详细全面地提取文件中的 数据 ,并整理成可视化数据表 格,逻辑性强 、指标清晰 。


2025-

♦ 5.5 %

♦SS 2%

♦0.5 W

01»

551.2

0*

1W7W

K

W3.W

285-

MM

♦75.

2βmo

♦7,4

♦42.

»<55

♦11,

01-30

5*

X

9%

2%

08K

2D25-

1183-3

♦53

♦22.

2SM4.Q

♦6.9

♦2

233.81

♦3Je

♦3.2

01-31

3K

K

K

K

2Q2S-

1338Q

♦3.5

♦1M

2∙7O7O

♦4.3

♦3Q

238.20

♦2S

♦18

02X)1

HK

K

4%

2025-

1460 £

♦2.5

♦0.2

30349J3

♦ 5.0

♦X2

242.83

♦12

♦1.S

W-OJ

%

8X

4%

2025-

1845.4

♦B.5

♦1Z

3186QD

♦7.4

♦&J0

24B W

♦2J>

♦2.1

W-OS

*

7*

X

K

3*

3M

2025-

1704,0

♦11.

+IB

30334JO

♦Q

-4.B

244.57

-13

0704

5

X

%

X

5%

2025-

18633

♦3.5

-2.4

2114X0

-2β.

-3α

245.21

*2Λ

♦0.2

∞-05

X

3*

7%

6*

20iS-

1514c0

-XD

-SO

2OO3&D

♦19

-&2

2*1

♦2.1

-14

02-0S

X

X

X

X

5X

4X

2025-

M2&]

♦1S

-8.9

19362.0

+IOl

-M

237^2

♦12

-IB

∞<J7

X

OX

1

K

202»

131B.4

•15

-XS

1BS3&D

*1βL

*2.2

23S.3S

9

♦to

02∙0B

X

IX

*

5%

4X


Open AI o3mini

暂不支持附件上传, 响应速度 快,能够快速读取粘贴数据 , 输出结果格式工整 、简洁 。


t公■**>力代咎*・后"人员3UMrrmm! {食・业在毋診砲性j.

■ HttQt2Q”年同Ir的白分tt Ttt^6M-BWttWSittt.

原籍£«4>2025122日己合并处・.


日■

9J8* Sfl

(方人 次)

MV ■■■ 2024 KRtt E

MV 血!与 g19

Rtt (*>

公图事 IftB

併人 次)

r* itft6 2024#

QtC (%)

公・书 M⅞

2019

Htt

(*)

RJKB OLfl

O5A 次)

RKV 0■2024# ntt

RM ifte 28»# mt 保,

202« *2

1318.4

-1.6*

IAM

9

ιe.iH

2AB%

23B.36

R96*

za<κ

2025 #2fi 7

1425.1

1与*

&4%

B362

Xm

1X2¼

237.B2

&21X

t5Jβ⅜

26 2βB

15M

T*

&仪

20038

,取

1ftft⅜

2"68

235¾

75H

2025 #2«

1M3J

3.6%

1Z3H

21143

'2tkB⅝

'1β<⅜

24*21

2.2?%

M2K

2025 ■2

4B

1704

11.5K

2&5K

30334

4.7M

1M5%

244.57

0.5SM

tt4⅜

2025 23

16464

5%

1&4%

318β0

7JH

[83%

248

2,03%

6%

2025 F

2

14C0.6

2.5%

&5%

30349

5*

[4d3¾

Z42.B3

1.38*

u.n⅛

2035 Z

1

1338

35M

ms¼

W07

49M

IMK

23&2

2.84“

t29H

2025

>ιfl

1133.2

B.3H

94%

28844

L

164%

23&81

16%

me*


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


文件数据读取


rtιι^ Fcixhvt Tiantpon PauSummary

BM

KB*t⅞* (万人余}

tm*»SM±

tMI∙ii∙0

公篇■ii∙

Dote

Rollwaγ TfθfMφ∙rt IlOkI

Y∙Y Change

Roed TreMport (Wk)

YoY Ow*oe

Alr

202&-D2-08

131B-4

d.5%

18936

♦ 19.1%

23*

2O26"14

2025 02 07 »25-02-00

]42SJ

1514.0

*LS¼

T∙Q*

19962

10098

♦ IdO* 419%

23

241

2Q2β∕VIb

”141

BJ$

fX2%

17061

7035-02-05 t025∙02-04

1663S VIM.O

♦3.5M

♦n«%

2tU0

30»4

•36.8%

♦4.7%

24!

2+

202bn∕16

½026

f2β%

t7&%

ιno>

2025-02-03

1X5,4

25%

318M

+7,4%

241

2025"”

123»?

f2.7H

T3,0%

KMl

202S-02-02

2025-02-01

14∂0.6

1338 0

*2.6*⅝

♦3.8*

30349

2P707

&。%

+4J%

24

231

Kimi k1.5

2O25C∕18

13444

M24¼

A5"

192A

Claude 3.5 sonnet

202S-D1-31

202S-DV3□

HB3.2

967.A

♦5.3%

♦7.9%

2SB44

2811D

.&?%

+Z*K

23

22(

2O25Π∕1β

,2β⅛3

jM2*

14.1%

ISftW

2025-D1-29

S51.2

4.gχ

“71

♦ &5*

2

能够快速读取文件数据,

2O25C∕2O

381

Z25%

t54%

M6O5

很好地完成了数据读取及提取

2Q2S∙D1∙28

»25-01-27

77⅛.0

1«Z4

γ.ι>%

♦7.5%

1941E

2*253

f5u2%

-5∙t⅜

IBd 22

JO25fl∕21

,Sg

T&1K

3.4%

71443

202S-01-W

2024-01-2«

1453.1 IBWJ

•12.1%

♦*g*

296

2X72

♦rox

♦173%

23

24<

整理成可视化数据表格,

2O25C∕22

∙3gN

T 3.9%

tt5%

X749

任务 ,没有漏数据指标 ,数据

M2 MOl-M

14321

♦17.4%

24«5S

♦22»

2*

填入数据有所缺失 。

2025C∕23

1316 S

f7.4M

1.2”

24G2S

逻辑性很好

202S-D1-23

20Z5-01-22

1316.B

1332^

♦7.4%

♦3.9%

24025

ZTzW

♦34.3%

♦1 7%

23t

23

2025∏∕24

t43Zt

T174X

tB.B¼

24B68

202S-0b2)

2025-01-20

1312.3

1359J

♦B.VH

♦12.5H

2M43

20M5

♦ 15.8H

♦n.m

22<

22

2O25C∕25

1S19l7

W7SH

tB,1⅜

2⅞472

2025-01-19 joss-Oils

1289.3

1344.4

.12.2¼

• 22.4

19826

IS94

*10-8%

»4.9%

22<

22

2O2E∏∕26

t45Ml

f1Zl*

“.4%

24B26

»25-01-17

123 7

♦2.7%

55

♦51*

22

2O25∏∕27

1337.4

T759⅛

B%

24253

M2S-01-16

202S-01-1S

12M6

W4,l

♦26%

-«.2%

1"07

TM6

∙9.1<K

-2.4%

22t

2O25∏∕2B

77β

46%

4-4 7⅜

194tβ

K2⅛-01-14

I(WQ

f ,1

m6

-1J.7%.

26

2O25∏∕Z9

551.2

,0.9%

,29l%

I9B7T


结论


□ DeepSeek R1Claude 3.5 sonnet均能很好的完成文件数据读取任务 ,生成的表格逻辑性强 、数据指标清晰 ,Claude 3.5 sonnet一 次性完成表格生成后支持直接复制和表格文件下载。

Open AI o3mini能够更加高效地完成数据提取任务,输出表格准确,但暂不支持附件上传 ,文件读取依靠粘贴稍显不便; Kimi k1.5文 件数据提取有明显空缺。


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


文本数据集成


ZaB ♦• an 111

'MW 29”.


任务


提示词


1 、分别阅读约7000token15000token的文

本内容,测试模型对中 、长文本处理效果

2 、整理集成可视化的数据表格

3 、按照日期规范排序


【所需阅读文本】请根据以上文本完成以下三个任务: 1 、 阅读 文本内容; 2 、整理集成可视化的数据表格; 3 、按照日期规范排 序(直接分析并输出结果, 不使用python)



DeepSeek R1

一般文本( 7000token ): 能 详细全面地提取文本数据 , 并 集成可视化表格 , 但受大样本 或模型稳定性影响 , 输出表格 末尾缺失 ,需要重复尝试生成 。

长文本( 15000token ) :暂时 无法给出答复 。



体上应对有序有效.总体运行平穩,经受住了复杂恶劣天气的严变考验二 个任务:1、阅读文本内容;2、整理量成可视化的数据表格;3、按輯日 出结果.不使用PythQn)


Qr你好.这个问题我暫时无法回答.让我们換个话題再再覇吧

C)Q


Open AI o3mini 一般文本( 7000token ) : 能够高效提取文本中的数据, 并整理成可视化数据表格 , 格式工整 、简洁 ,数据准确 但数据维度有所缺失 。

长文本( 15000token ) : 反应迅速, 高效提取文本中 数据,输出格式规范的数据 表格 ,但集成数据维度仍然 不够全面 。


ItzwAnxaa 候总■迅,   △■人员席龍  *j»xa   MiA■

a*      四人次}        ,力人次)      (方A*)       (方人次)     <ΛA⅛)


2026 2 8

20M7.B

13184

1β83β

78

Z3&35

2D2B1F2 月冶

21096.2

U25.1

1»362

ToL3

237B2

202/2 R6

21B75.1

5"

20038

BM

24Ifie

20252 5

2315X8

⅞Θ63J

21143

1025

M⅝21

2025S2 4

924M8

1704

30334

122

M457

202 2 3

33∙7β.2

*6W

6∙M

122 •

Me

202C#2 月汨

32194.3

MB0.β

30349

19

24233

相国如費束,

TTBJHfafi «««

B*

MBttAftSUIIfl 《万AI

MHFH∙ EXw

公・人BW

IKAJO

水・■■■ 4万E

SM城■ 4方心)

2025*2 8

2O567.B

131B^

1B»36

78

23&3S

2025*3 7

TIQgZ

151

10)92

B

ZU

2025*2 8

21875.1

1514

20038

814

24168

2D2SW2 恥日

m&xa

1ββ3.3

21149

W2.3

24&21

ZOZbMZ 4

32404.6

1704

30334

IZZ

2“ 67

2Q25 2 3

00

184“

316βt>

88

MS


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


文本数据集成

日■          *社金flIE■人员*i9)∙[方AAO    ■■ii∙(万人次)    公JBAB

Claude 3.5 sonnet

一般文本( 7000token ) : 能够准确提取文本数据 ,并 整理成可视化图表 ,表格文 字简洁, 没有提及文本中的 环比和同比数据

已克StN本用僅/氮副常理.fifi KH#汴他2O2S*春悠费MBFSM #UAI! ©"SUMA次) K方人次I ■5人次I »■5人;KJ *U75人:Kl

IM  1       1M2d4        IOXQ      1532dD     $3.3       23.18

US   2         1B444.9          1W4.1         17 061.0      49.9         219.90

«6  3      1SH&1        120⅞.∂     180    M .7       »0*2

117   4         20101.1           1238.7        IBSdIO      S9.7         223.66

1>B   S       20e∏.4         13÷*.∙<      19234 0     M9        224.6

E  A       2MΠ4        1,HeS      IQgAa     73.0       934.45

UO  7       22Z56.B        QgJ      20605.0    M2       224.4«

141   ∙       MOMJ         1*12       21443 0     ?3.4        2 2“41

122   9         23388.5          1332.2       21749 0      70l4         233.91

U3  10      2bg1S       13U.B      2K2E0    M.0       2M

Kimi k1.5

一般文本( 7000token ) : 能够快速提取文本数据 ,并整 理成可视化数据表格,数据准 确,所提取数据维度不够全面 。

26 1 UB   ISO"』                  IaM            ”Me

M26 1 月必日   184∙.9                   HUI            1W1

M25 韋!月節8   W78S.1                      1g2e             17307

20251 月口日    2Q18J                        IZtB .7               18581

202S<1fltβθ    20871.4                         1⅞44.4                19234

2025*1 月《9日    21411.B                          1289.3                1962«

202S*1^20B   22256.B                       13B91               206G⅞

124   11        26604.5          1432.1        24458.0      77j6         23&S4

IM   12       27318.8         1519-7       254710     B4 6        240.46

6  13       2∆5ft1.5         14SX1       2 326.0     S.9        332"

卿比    ntt2024< KKW⅞4方人:S)   评比    m2024年   公靄人K4

长文本( 15000token ): 长文本粘贴后会自动形成文 件, 能够准确集成文本数据 表格,但数据维度有限 。

a<ι∙*⅞MM>∙w⅜∙∙*M∙ute* w>n

M>      MMM∙     W* IaB MM⅜   Maa  V*MM∙ MM^to

φ                                          ■»«»•  ■»♦-      aww  tau  Va     ■  ta»

■BMHI  ▲■♦     HMM  gt  *M    m  UUE

・■■ ・・,'■•«・ f ~t⅝HI⅝■•■♦—'∙⅜⅜I         M∙∙4M  IMU     Mal   I »M    M  «MM

∙>M>4*  IMM     l⅛*M  f  W   M  MM>

芝下二,r u-^ rτ                           βι>⅛ι∙t∙   **at      β∙*M   E  am     ∙o  •••

r(i—ul—— ⅝5n-⅝jτ »■—i⅛m-—•          BMi-*  ιwc^     nmι  wκ, nm   t»   ■

-"∙*∙.' -J— _ .…  “ _ 2- - - ∙                 ≡MI4*   («■•      MWU  UM*  aa∙    IM  Ml.

MM∙.  IMi     Q,  IM MT    KM  >Ba

• *≡<∙≡ββ≡                                 «(»«*«  QMz      ι∙∙m   ww  ww    ∙n  m∙

■*«»■  a*e-      mom   ■  w^    A4  an*

M∙*Ji  ∙KC*‰    MUU   E  J.    *>  ■=

______                —«■ J   ∙K∙.4      ⅝⅜⅜ftl   UMa  MM∙     «4   IBM .nB^HHri..∙*awΛlβ. ¼⅜Aβ BjbhBm aMHBWv                                                      mm⅛

« ⅜ UlHlM 1 I —1⅝ fll ⅝B-1 Jll IT —              ■•・・《■   ∙*rE      RVM  ,IW  Mer     «M  ∙∙∙

10.9%    ∙2∙7M        ItMI               7J%     ∙82¾        T7O61

长文本( 15000token ): 同     1.BK   -2∙7⅝     120ZJθ         7S⅝   2.6%     17307

样能够高效准确地提取文本中    7.0*  5.QM    123B.7       30%  N7*    tS5ft⅞

IB%    β.0H        1344.4             SS⅝    2X4⅝       >9234

数据 ,较一般长度文本所集成    2.6K  10.BK    1299.3        Y.1¾  1X2%    >9 8 2 6

3.9W     13.0K        1359.1               A4M    12B%        20606

数据维度反而更加全面 。

lβ⅛     15.2H        1312.3               -14¾    &1K         2M43

结论


□一般文本处理任务中,DeepSeek R1所提取的文本数据维度最为全面,但容易受文本长度或模型稳定性影响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题 ,没有完整集成到可视化表格中;

□长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面; 由于文本过长DeepSeek R1无法完成任务;

□综合来看 ,Open AI o3mini响应最快效率最高,但在数据集成维度上稍显不足,同时与Claude 3.5 sonnet所输出的表格更为工整 、简洁。


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


数据分析


任务


提示词


1 、读取titanic遇难者名单excel

2 、找出其中规律


请读取所上传的titanic遇难者名单数据文件, 并分析找出其中规律



DeepSeek R1

详细展示长思维链,精准提取关键指 标“幸存率 ”,分析多个因素特征对 幸存率的影响 ,结合历史背景对数据 及规律进行验证 ,并敏锐察觉数据异 常,提出了异常处理建议 。


2.关覆規緯分析

(1) tt<u⅝ffi IPciasi)与奏存車

头号総PdX*1)車存率,高(以62%).困貝优先使用穀生敏且■近甲板.

♦ SWIfi (PcIm^2)奉存串次之他&M).

三司施PCiMk3)春号庫■任I24XL乗害费源分配受限且位置傷运.

(2)性别SOX)与幸存辜

女性幸存辜显H育于男性(約74% v$ 19%›.符合黄女儿,优先-IWU.

男性尤買在狂舱位中存活率梭依IJQ三号舱男慢幸存率不足10%).

(3)年依(Age)与奉耳串

.Jia (Ag∙u8)車存率K高览sox以上),β^aΛ^ff≡a≡.

成年人 年壮国大幸存事可雙下降g060岁次IJR害夢未存活).

蠶失年絵載*:需进一步处理(如用中St故填充I.

XXMK

■雪舱号I2n) 8(ι较$.电火0翩仮■较寛蹙,M. COEL■0*存里相*.

■ 用常■AhtJlII批索需去书有IClD 91fl, Hk282.375信*百;.可藩国欝錄宣我⅞SH0^W.

4总结

• 1^V≡* 女笹、Λl.. Ktt&I. >r>5<C.

• BWft^程含历史,■〔就依经堂年碘Qd先9).

改城万育处亚*矢*傲叡貰,重入金所倉看住■龄■.


Open AI o3mini

响应速度快, 高效输出数据分析 结果, 分析各因素对关键指标生 存率的影响, 语言表达自然 , 重 点突出结合历史背景对数据规律 进行验证,但没有察觉数据异常 。


已雁理,持喂9

FUIB出一林有博TitaniCB(寓I6WWO.是音生逐.iβfttWS.姓各、住别.年IL $£Kfl, It

4h M飽.笈帕港口*也■} 鹤k軽労斬纳翅*隨禽.里,官

2損事性分析与規棒

41)住柄生汪

-建MT

■从M中可以■風出,文軼MMgiWirfh住.

*如.δn>lfi<4.舌 $« Λ⅛rtw⅛.时風的 XrjVm »»1-而男修 E*J <MR$ 北承示 WrvivX Aa

'再 HlCS

话与当村的女七儿■任先.款生Fa-IL

0总结

18合上述分析,可以用辆出他加:週靈甫书堂敖BS中的王曼欣If

Λ5Wβl3WaM7S11.相含.好女和儿■賞先.師经38看.

舱也■扱弦IIWiI客也L显尊齿寓于三苦飴,反強 了航上社居涪触位的立A麻灌生机合的石*.

■ ■:儿宣彼发負* I尤复晶女传I生还装立Ifi舒改据中汗荏R笑,仍fKM9声写历史记樂一

援州因H票儼禹(HfiλW: m雪更容!!生M∙冋橙停及了牍济条件和社合図■船1.

•MifflWSX三恵ASt闻怦国行可能在一定WjE堂:Mt車.但It要站台更多文计■秉熏人 探吮

Hcl不声建0BeJHNi8*[可*有听不用.遊而彰嗣上还.

^WSβfiejR≡^tfΛBWM!I!WWjΛit∙Φ IB2W83G.凍■用一 ∙K41 養快了l

占世.也印证了历史记ltm.fl!it先.13女,L!⅛fc先.用E际*我.


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


数据分析


Claude 3.5

sonnet

提供数据分析程序代码, 能够提取大部分特征并 对其与生存率的关联进 行分析 ,但最终没有形 成明确的结论 。


结论


旅于分桁結果.我发现TFE贽規律:

L性朧异:

女性的生存书足3高于男性

■这"能此因力妇女和儿貪优先('的衞离政奈

2.舱位等掘影响:

■ 3舱乘客的生存率依高

■三等H6褻*的生存率城能

这反映广计金阶公以生并挑金的影响

a年龄特征:

■儿近的建存率较富

■中年来客的史存率相时较依

■忐年桑/的生存率最低

4.塞崎港口影响:

■从不用避门篌船的架自生存*有所不Iul

■这可■能与乗客的社会跄諦电位4

5. *鹿因套:

■在家庭成圻陶行的乘客生作*4

■这町便是因为家人之间相反照应

这些发现祸云,社会曲fI.舱位年焼、性别.年齢¥因未计生存机会的頂史书响,款生设施 的分也和使用吋班存任偏向性.反映r当时的社会价值呢出胧范。


Kimi k1.5

能够 精 准 分 析 关 键 指标 生 存 率 , 但 对 特征 提 取 不 完 整 , 仅能 识 别 较 为 浅 层 的数 据 关 联 , 分 析 能力相对较弱 。


■式帳刷

1女他和儿■优先

d规显示,女性和儿童的生存率显¥高于男性和成年A.达希合犀喪尼元号i?Me/件車.女住和 儿■优先.的我損原別.

2.险位,扱对爰存事内影■

QH舱和-号髄索宫的生存军显署制于三書飴乘客,这可離与依位置ID攸復罰牙的分也宵关.

3 ItiI義轟对生存車釣影■

。有裁β同行的県咨生存率碰高.尤其是女性用儿■.这可Iig与京富成员之尚的互助有关.

4∙事的与生存*約关*

•• ■价较■g事畧(头書舗和二督触j生存率较高.这片舱拉需般的E0-SL

可很化

为了更置我咕IR示分析结WL可以使用以下可復比图義

1生存庫株状册技性芻船■修筑和枉州分绢履示生*車

2.年■分布■方IE国示唳百年般的份布11况.

3*信S布e线图修示不日船累整缴的票价分布.

4車■!关系与生存事触靈何 解示事同关系(SibSp ÷ PafCh)与隼存辜的关JJL

酬论

通口对奉壊尼克号重嘗JME的分圻,可壊得出展下绪祝

-女任和儿内生存軍 » 于男性初JeIr人、

头号舱也二寻館鎌看約生存寧同■喜于三善IeIr

■ ■#>■同行巾■€生存寧M*.

*■恰校内垂書生存率融

这些靖论与历史记录相常次頸碑.建一步IIii了安坦Ie亮号二關口忤中的费搜摩喇?0乗宫将标再生存辜 130._____________________________________________


□ DeepSeek R1Open AI o3mini的数据分析能力相当,且领先其他两个模型 ,均能够精准抓取数据核心指标并做统计,找到各特征与核心 指标的关联,其中R1分析逻辑更加清晰严谨 ,而o3推理更加高效;

□ Kimi k1.5推理逻辑清晰但分析能力相对较弱, Claude 3.5 sonnet能够提供分析思路但没有明确结论。


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


数据挖掘


任务


1 、读取即将上映的2025年电影数据集

2 、对数据集进行深入分析和数据挖掘


DeepSeek R1

能够准确对数据进行分类,从多个维度进行梳理和分析,借助可视化图表进行数据挖掘,基于分析结 果提供可行建议,但整体数据挖掘深度较浅,缺少对不同类型数据直接关联性的探究 。


提示词


第一轮对话:


请帮我分析这一份数据文件

UPCQEing_movies_2025

CSV, 52.62 KB


©k CSV


÷≡≡三二三 =≡三=



---:0-1-二■ ■'■' ^uu^a wu 1"≡IL3 "3“4



-XX _ P wur N E gMI




第二轮对话:


(基于初步分析结果, 选择其中一部分或某个方 向进行深入的数据挖掘)


b于所上传数据,对数据的潜在用途1进行深入地数据挖握和分析



请对其中中文电影进行详细且深入的数据分析


2发现

分布

• X≡⅜B*> tt60X (如(The Wtd ftobot> (Captain Amenca: 8rave New World)).

XttM

日通 便 CMtt rt-Λ-O-Hj 豊王3)、西班牙笛《如 ILihabitecidndealladoIk 懸鴻、精语等.

那分小众18®电影(如校IR也亚语《SuwmWRowX.

Je坪分电JB (Vote-Memg•* 8)

• (TheWiHRobot)評分8385, SUB 4058 U, 2024-09-12).

• (Row> if ^ 8.401 (校脱缴亜语,2024-08-29).

• CAttock oo Tltart THE LAST ATTACK>:評分 9.6 (日通 2024-11-08.但投 1M87).

曾评分电酎(¥ote_ever«ge < 5)

• (l⅝ler Pan'* Mevedand MigMmareI许分&4 {美谓,2025-01-UL

♦ CTheMwYrapI 律分 4325 (英语,2024-08-23),

未寻分电例(vote.ceuπt ≡ 0)

$都 2025 年上跟的电彩得束升放*分,如(Captain America: Brave New W(XId> (Bridget Jones Uad Atom Ihe θoy>.

3.旳闾分布

• 2024年上:多敢电E集中在20248∙12月.

• 2025 年上■:

1月§疑#英遇电影(如聴選《召2+3∙Q"k NUrl办).

2 月 奥语电影壁■価(Ybe Wftcher &es Qf the Deep)).


4典—《

Ssiaiciiveiifliaftfl

<tt*ni*> ]0p∙<Mto∙l**Swft)

<4H1»Xl> IDttMAft OiMtSHnIKOi

Mtħfi lf!*K> Iot∙ ∙Mκ*utw* ft∙B<wn

CSR2∙∙**> i¼eZħs2l

OmG IUv,Uar. LXivwtecnRrel <^*1SiAS4) IMBWtKkytaUeal VduI

(fl. W f∏e UftQvice)

5界—ð —注

B∙⅝B1Λ €«»««) l∞Him.%<■■,#塞■百方∙M0l*.

M*nn

心 5 ■贯一比 I» 6X3IL

Caetιt*χ> α∙t∑u*> Mfrnκ*AM6Lβ.                V

&市场趣议

1重点发:

关注202512月昆集上映期,提前布局春节档*椅.

励西电厳(如《期出没)4此))适合家庭齡,可联合亲子平台推广.

2 口鼻暨控:

SR^ (e.So等高评分电彭的长尾效应.

河耒评分IP电影(如{唐探1900加进行HHI热度分析.

3 AKIM

加强动作片与悬疑片的国际市场发行4如东南亚、北美华価凰}.


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


数据挖掘


Claude 3.5 sonnet

基于数据集 ,在整体数据概括后提供多个 深入数据挖掘方向 ,根据需求输入研究倾 向, 高效生成多个维度的数据分析, 语言 简洁,挖掘深度较浅 。


*Wft⅛tVria-WfiIKAft

这姑-卞*歹20珞年即俗LM电或曲曽:网文件,包會以上夫M幻"

但含毗8前电再妃总

• WftUħ!5fΓ7个M性JD. Zilfetv *a化卜∙H. l.MIm∙冷始M,;活仆《1#分人tk

fttf8βΛ 3UCSV It ISIΠT 8<fiw

品叫以得电ie行収ft? A的分析Jt如;

• itift<^i⅛⅛fttiΓ

评"分AiIR

*技月份的上K计划

-许分电舒修过

*H/*HlR体分斬?


。请疔其串中文电鄺更行冲囲且詳人的线W5外折

展卜航樹抄斬中丈电彩焼*二

IMftI* 32∙AetW%

怦分分布

■平均分:m>

■ M丛分:84

昆低分:6.1

• 75%Hif分任7J0以上

上映时向分布:

• Ql

• Q2 12

• Q3 79

■ X 5都一乐第 夕度&中文电把出中I M

臭型分冇

• ⅛^∕Wft^ 35%

剧情30%

■肉耳20%

if¼λa

■平均精都窮片2800

■我自12000

• JftflL 450 k

兩姿更H体的票个热脏介析叫?


Kimi k1.5

提供数据的潜在用途方向 ,深入分 析过程中,从多个维度(如时间 、 语言 、地区)深入挖掘数据意义和 关联性,进一步总结趋势结论并提 出相关建议 。



2. ffW5tfrβX

我朗*从以下几个Stf矗行分折:

« UfflM电喲上Wv与.

<«BO ■却电始召宮牙奋

WiHI度电片的3分砒MlJm布.

-是WJUt结合®XKUJI日■ 9析刊10信的电影巾IL

3.1?国罐9[分将

11 MIBβ^

a力現Ct了*在电船冷BtaSLdatd字的并俵计了与年Kl罰月能无tiLMi■.

3.2 ^mιιs⅝

2024≡ fit! ⅝KitillR. tMf^T*≡ 価月 *12L 2025任也看不少电密NfcI上■.尢K■衣年福1月気3I.

月度02024*8W^ttB-itil±β,可险工目力∙BH3.

7 ttMt

AR対毁*林入分*, 我打可1X9U下络眩

• F1M9A ⅞t±JKttllrtl*^^ISMS<tχ 224毎闻第石毎改电心尊*)*鹵.

∙ai¼*il电影占<!W殮,日诵电,滔分明,Mt>iaβ<KΛ*^?fJΦti.

内分分寄倉律力Qa“咬R的众认可Ot中"得分电史應車邮王』.

博区分-支黄布堵里喇MeM巾臣■"松大力.SS-4HHiXIrrRfWJW帝拎通卜电需 联的文Itw5.

电正好公旬 sxιβu<mΛwιwαι*Hβ Uilatsn∙力.

及仗 Hβ≡τ^⅛EMΦ⅛w^, u⅞⅞r≡nκnnv.

■众 SJUL⅞U^]SIΛB⅝IVff.tr^E<t.

過甘連聲Hfi. IlETN更好壊用解堂民王鳩的券BU好.R4UE6A酌》*#併卷裾豈叫.


结论


□ Kimi k1.5该任务中表现最为出色,对特征进行精准分类,从多维度深入挖掘指定数据的深层内涵和关联性;

□ DeepSeek R1Claude 3.5 sonnet同样能准确完成数据的分类任务,但数据之间的关联挖掘程度相对较浅;

□ Open AI o3mini受附件上传限制影响, 由于数据集较大 ,暂不能完成该任务。


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


数据可视化


任务


结论


基于titanic遇难者数据分析结果绘制可 视化图表


Open AI o3mini的数据可视化能力突出 ,能够直接高效地生成多种类型可视化图表 ,准确度高; DeepSeek R1 Kimi k 1 .5均能基于分析结果提供多种可视化图表绘制方案 ,但都需要依靠运行 Python代码才能完成绘图任务,部分代码会出现错误


Open AI o3mini

能够直接调用DALLE,根据分析结果和任务需求高效绘制各类可视化图 表,部分较为复杂的图表可能出现数据错误或无法生成的情况 。

Survival Count I Red: NQt Survived, Gtce: Survived)              -                   Survival by Pcla≡i

0


DeepSeek R1

能够结合数据样本和分析结果,提供多种可 视化图表绘制方案,但暂时不能直接绘制出 可视图表 ,需要将对应的绘图代码复制到本 地运行制作图表 。


Kimi k1.5

结合数据样本和分析结果 ,提供多种可视化 图表绘制方案及对应代码, 需采用Python代 码完成绘图任务 。大样本会省略数据;小样 本不省略数据 。



"





■ 柱状图(生还者和遇难者的比例、


按船舱等级分类的生还情况)



-2手存军控能依■■ HrgroUPb/按便也分婚.Hjf李存辜,0制柱VuE.

-■F别与壺存*.. IH交叉H (crosstab) Ctim哈奉行情就、第制第■柴影息

一一年*分布":分黑处理琴■,銘制至呑勻群愛存的比例■方册.

•・家慰腹積■分始计H車存庫.嬉制而线阳电柱状图.

-B■价与Ie位"用旗展冊展击不刚6位的n价分布.

*∙BH9Λ□∙*N舱位的处理方A H妃计■奉存图.

e. ■倂与储位的关H


»y»«n                                                                        ■■

sπ⅛.few#LMtjl• ∙rcU>>'.尸',©,《  U«•**!,XSlIb'χS3

Hτ.title!*F4re 0”*Lwu・・ ” r∙⅝seΛ9er CUitfcI .It.—1 ' 3ιιv-!^r Cta⅞⅜' I Vt,,Iabelr “L Flt.∏caU 'U<'!             ■



■ 年龄分布直方图、票价分布箱线图(展示不同船票等级的票价分布


■电

♦ ⅛rWM*4>fV*7XffeMta <ΦttftnβA vs13L

■■*玲3為唯存隼正相关.


Claude 3.5 sonnet

暂时不能直接绘制出可视图表, 需要将绘图 代码复制到本地运行 。


测试结果受到数据样本 、测试环境 、AI抽卡 、提示词模板等因素影响,仅供参考,无法作为决策制定 、质量评估或产品验证的最终依据 。


数据应用情况总结


DeepSeek R1


□文件数据读取完整无缺失

□数据分析全面 、逻辑清晰严谨

□网络爬虫任务数据爬取完整 、准确

□数据挖掘能够准确分类并提供建议

□数据可视化任务能力有待完善


Open AI o3 mini


□数据分析高效 、全面 、准确

□数据可视化能力突出 、直接生成

□网络爬虫任务爬取数据结果为空

□暂不支持上传数据附件

□数据挖掘深度较浅


Claude

3.5 sonnet


口数据读取输出逻辑性强 、指标清晰

□数据分析任务完成得较为简单

□爬虫数据采集未形成明确结论

□数据挖掘深度较浅

□暂不能直接绘制出可视图表


Kimi k1.5


□数据挖掘能力出色

□快速读取文件数据,提取网址链接

□长文本数据处理能力突出

□爬虫数据采集存在代码错误问题

□数据分析能力相对较弱


新思路:优势互补,协同应用


DeepSeek+Open A I

数据采集的 “ 天罗地网 ”

DeepSee k R1 负责精准爬取和筛 选数据 , Open AI o3mini 提供额 外的数据补充



DeepSeek+Kimi 数据分析的 “ 慧眼破局 ”

DeepSee k R1 负责深入分析和异 常检测 , Kimi k 1 . 5 提供深度挖掘 的思路 , 助于更精准发现数据规律



> 数据采集 〉 数据预处理〉数据分析 〉 可视化呈现



Claude+DeepSeek 数据处理的 “ 洗髓易筋 ”

Claude 3 . 5 Sonnet 在文本提取 上较稳定 , 可用于数据清洗 ,

DeepSee k R1 可确保数据完整性



Open A I+Kimi+Claude 数据呈现的 “ 画龙点睛 ”

Open AI o3mini 直接调用 DALLE 生成图表 , Kimi k 1 . 5 提 供 Python 代码支持 , Claude 3 . 5 Sonnet 负责图表逻辑优化


新思路: DeepSeek R1的数据应用


中文数据处理优势


中小企业AI定制化服务:为中小企业



供定制化的AI解决方案 ,如智能客服 、营销 和办公工具,提升企业竞争力 。

开源AI教育平台 :借助DeepSeek R1 的低成本特性 ,创建开源AI教育平台 ,提供 免费课程和实验资源,促进AI教育普及 。

智能编程教育助手: 为编程学生提供实



低成本高性能优势


数据读取分析能力



时编程指导, 自动生成代码示例 ,帮助解决 编程难题 。

自动化代码审查工具: 自动审查代码 ,



编程代码生成能力


发现潜在问题并提供优化建议 ,提升开发效 率与代码质量 。


创意写作生成能力



智 能 中 文 古 籍 修 复 与 注 释 : 利用 DeepSeek R1强大的中文理解能力, 自动识 别并修复古籍中的破损文字, 同时生成准确的 注释和解释 ,帮助修复难以辨认的古籍内容 。

中 文 法 律 文 本 分 析 与 生 成 : 基于 DeepSeek R1的中文数据处理能力 ,快速分 析法律文本,提取关键信息, 自动生成合同草 案 、法律意见书等,提高律师工作效率 。


智能医疗数据分析与诊断:构建智能医疗 平台,分析病历 、检查报告和基因数据 ,帮助 医生提供更准确的诊断与治疗方案 。

金融风险预测与管理:开发金融风险分析 工具 ,收集并分析市场数据,预测风险并为金 融机构提供管理建议 。


智能文学创作辅助 :为作家提供创作灵感 和文本构思 ,生成符合中文文学传统的故事情 节和诗句,助力突破创作瓶颈 。

智能广告创意生成:根据产品特点和目标 受众自动生成创意广告文案和宣传语,提高广 告创作效率 。


新思路: Open AI o3mini的数据应用


复杂数据模式识别:借助o3mini高效分 析复杂数据 ,帮助科学研究和工程领域发现 模式和规律 ,如天文学中的星系演化或地质


推理响应速度快



学中的地震数据分析 。


多源数据融合分析:在智能交通和城市 规划中,o3mini有助于将不同来源的数据 (如交通流量 、气象数据等)进行融合分析,



数据分析效率高


预测交通拥堵 ,为城市规划提供决策支持 。


格 式 化 输 出能 力



交互式数据可视化:在商业智能和数据


分析领域 ,o3mini可以将多维数据以可视化 的方式呈现,并支持用户进行交互式分析 。

实时数据可视化与预警:在实时监控和



数据可视化优势


数据分析中 ,o3mini可以实时将数据以可视 化的方式展示,并支持用户与数据进行交互 。


写作情感表达能力



实时数据流处理与决策 :利用o3mini在物 联网和工业自动化领域 ,快速处理来自传感器 和设备的实时数据 ,进行即时分析和决策 ,减 少停机时间,提高生产效率 。

高频交易数据分析 :利用o3mini快速处理 高频交易数据 ,识别市场趋势和交易模式, 为 交易者提供实时决策支持 。


数据报告自动化生成基于o3mini自动 生成格式化的数据报告,包括图表 、表格和文 字说明 ,帮助管理者快速理解分析结果 。

数据接口标准化:根据标准格式输出数据, 利用o3mini方便不同系统和平台之间的数据 共享,提升跨机构协作效率 。


情感分析与数据解读利用o3mini结合 情感分析,对数据进行深入解读 ,帮助市场调 研等领域理解消费者情感,优化产品和策略 。

故事化数据呈现 :借助o3mini将数据以 故事的形式呈现,增强数据的可读性和吸引力, 帮助公众理解复杂的科学和技术知识 。



要怎么做?


撰写文章标题指令



指令 : 我想让您担任学术期刊编辑,我将向您提供一份手稿摘要,您将向我提供 5 个好的研究论文英文标题,并解释为什 么这个标题是好的 。请将输出结果以 Markdown 表格的形式提供,表格有两列,标题为中文 。第一列给出英文标题, 第二 列给出中文解释 。以下文本为摘要: 【指令后加上文章的摘要】 。


我想让您担任学术期刊编辑,我将向您提供一份手稿摘要,您将向我提供5个好的研究论文英文标 题,并解释为什么这个标题是好的。请将输出结果以MarkdoWn表格的形式提供,表格有两列,标 题为中文.第一列给出英文标题,第二列给出中文解释。以下文本为摘要:As human activities intensify, the structures of ecosystems and their food webs often reorganize. Through the study of mesocosms harboring a diverse benthic coastal community, we reveal that food web architecture can be inflexible under ocean warming and acidification and unable to compensate for the decline or proliferation of taxa. Key stabilizing processes, including functional redundancy, trophie compensation, and species substitution, were largely absent under future climate conditions. A trophic pyramid emerged in which biomass expanded at the base and top but contracted in the center. This structure may characterize a Uansitionary state before collapse into shortened, bottom-heavy food webs that characterize ecosystems subject to persistent abiotic stress. We show that where food web architecture lacks adjustability, the adaptive capacity of ecosystems to global change is weak and ecosystem degradation likely.


典巳退度思考(用时21I V


markdown                                                                         靈制

I英文标■ I中文解H I

I.....1...--1

I —Rigid Trophic Architectures Under Climate Stress: Experimental Evidence of Ecosystem Inflex Ibility S Coastal BenthU Conmunitles*≡  标*蚤TRigW"强调食物网刷性特征.使用■号分万明■研究靖景,

包含关iS∙∙Clizte Stress^WEcosystem InnexWiXity".突出实就证据的發撕住,符含海洋生总学期刊的尸選风 格.I

∙ 'The Collapse Of Compensatory Mechanisms: Hg Qeean Wamiftg Disables Food Web Adjustability in Coastal Ecosystees** 様■以検心发SrComPenSeiOry Mechanisms Collapse"JFfM» Ii问式姑期I导谨者离考 InjW失效过程.SaiT'Disables"生动描述气候影响,明用研究主体为海岸融生毒系统,具辱学术警示你1.

• -Climate-Driven Trophic Squeeze: Experijiental Validation of Nid-Trophic Contraction in Futur e Marine Food WebS- 创遣新木!“Trophic SqueeZe'■増强记忆点,"Mid-Trophic COntraLEn“麻磷紙括营养級 收编现奪,"Experimental VaIidatn"强调方法学贡飘,■号结构平衡创新性与科学性.通合高舒■力期刊.1

FrOm Pyranids to Collapse Trajectories: Thermal Stress Induces Non-Linear Structural Transi tlons In Coastal FoQd WeOsc ;比■手法(叩yramids to COUaPSe“)増強可读性,使用"Nαn~Uner"突出麟纨性 相变找径.Fndge$"明俏因果关厳,双名词结构IMði理论油度与实证裁现,适用于牌学履期刊.I

I "“Structural Inertia of Food Webs Under GIobal Change: Experimental Denonstretion Of Lost Ada ptIve Capacity in Benthlc Ecosystems** "Structuml InertIa”療盅第植住现理论创斷“Lost Adaptive C aacityR直报研究糠心结论「ExperFtal EQcstrZM>N百化证室*導 ■号后蹲定研究范围,符合鎌屮生術学円物 的政策相关性需求.


中-英 、英-中互译指令

指令 : 我想让你充当一名科研类的英汉翻译, 我会向你提供一种语言的一些段落,你的任务是将这些段落准确地 、学术性

地翻译成另一种语言 。翻译后不要重复原文提供的段落 。您应使用人工智能工具(如自然语言处理) 以及有关有效写作技巧

的修辞知识和经验进行回复 。我会给你如下段落,请告诉我是用什么语言写的,然后翻译 。我希望你能以标记表的形式给出


输出结果,其中第一列是原文,第二列是翻译后的句子,

所提供段落的语言是中文 ,以下是按要求的标记表格式翻译成英文的译文:

Original (Chinese)

捕食是一个基本的生态过程 ,捕食的定义为 :一种生物(捕食 者)捕食了另一种生物(猎物)( Begon等, 1997)

在群落范围内 ,捕食能够影响某一营养等级的动态 ,也能够影 响整个群落结构的动态 。

对于整个群落来说 ,捕食对于保持种群结构稳定 、食物网进程 及种群内物种数量稳定具有重要意义( Menge等, 1986 GarrityLevings,1981;MurdochOaten, 1975 )。

一些因子,如: 捕食者规格 ( EnerHughes, 1978) 、栖息 环境复杂程度等都会影响捕食进而影响捕食者与猎物之间的动 态关系 。

每行只给出一个句子

Translation (English)

Predation is a fundamental ecological process ,defined as one organism (predator) preying onanother organism (prey) (Begon et al., 1997).

Within a community, predation can affect thedynamics of a specific trophic level as well as thedynamics of the entire community structure.

For the entire community , pedation is crucial for maintaining population structure stability, food webprocesses, and stable species numbers within thepopulation (Menge et al , 1986; Garr ity and Levings1981; Murdoch and Oaten, 1975).

Some factors , such as predator size (Elner andHughes , 1978) and habitat complexity, can affectpredation and subsequently influence the dynamicrelationship between predators and prey.


中文学术写作润色指令


指令 : 作为中文学术论文写作优化助手,您的任务是改进所提供文本的拼写 、语法 、清晰度 、简洁性和整体可读性 , 同时分解长句,减少重复,并提供改进建议 。请仅提供文本的更正版本,并附上解释 。以 markdown 表格的形式提供 输出结果,每个句子单独成行 。第一列为原句,第二列为修改后的句子,第三列为中文解释 。请编辑以下文本:


原始句子


捕食是一个基本的生态过程,捕食的定义为:一 种生物(捕食者)捕食了另一种生物(猎物)(Begon 等, 1997)

在群落范围内, 捕食能够影响某一营养等级的动 态,也能够影响整个群落结构的动态 。


对于整个群落来说,捕食对于保持种群结构稳定 、 食物网进程及种群内物种数量稳定具有重要意义 ( Menge等, 1 986; GarrityLevings, 1981; MurdochOaten, 1975)


一些因子, 如 : 捕食者规格 ( EnerHughes , 1978) 、栖息环境复杂程度等都会影响捕食进而 影响捕食者与猎物之间的动态关系 。


优化后句子


捕食是一个基本的生态过程,定义为一种生物 (捕食者) 捕食另一种生物(猎物)(Begon等 , 1997)

在群落范围内,捕食能影响某一营养等级及整 个群落结构的动态 。


对整个群落而言,捕食对保持种群结构稳定 、 食物网进程和物种数量稳定具有重要意义 (Menge等, 1986;GarrityLevings, 1981; MurdochOaten,1975)


一 些 因 素 , 如 捕 食 者 规 格 ( E I n e r Hughes,1978)和栖息环境复杂程度 ,会影响 捕食以及捕食者与猎物之间的动态关系 。


中文释义


删除了多余的 ”捕食的“和"了", 使句子更简洁 。


删除了多余的"能够" ,并将两个 动态合并在一起,使句子更简洁。


删除了多余的“ 对于 ",并将 ” 及“替换为"和",使句子更简洁。


将" 因子"替换为 " 因素 " ,删除了 多余的 ”如:"和"等"


英文学术写作润色指令


指令 : 下面是一篇学术论文中的一个段落 。润色文字以符合学术风格,改进拼写 、语法 、清晰度 、简洁性和整体可 读性 。必要时,重写整个句子 。此外,用标记符表格列出所有修改,并解释修改原因。


原始文本


Numerous marine molluscs, including both gastropods and bivalves, show phenotypicplasticity in their shell morphology in response to predation risk (Appleton & Palmer1988 , Trussell & Smith 2000 , Bourdeau 2010). Predation can therefore act as adirectional selection stressor that produces particular prey phenotypes, such as thicker and heavier shells, round shell shape, and lower growth rate (Leonard et al. 1999,Trussell & Nicklin 2002, Hollander & Butlin 2010, Bourdeau 2010) that can decrease the susceptibility to predation.

修改

解释

将“molluscs ”替换为 “mollusks ”

将“molluscs ”替换为“mollusks ”

将“show ”替换为“exhibit ”

将“show ”替换为“exhibit ”

重新组织句子结构

重新组织句子结构

在每个引用年份后添加逗号

在每个引用年份后添加逗号


修正后文本


Numerous marine mollusks, including both gastropods and bivalves, exhibit phenotypic plasticity in their shell morphology in response to predation risk. Predation can act as a directional selection pressure, resulting in specific prey phenotypes, such as thicker and heavier shells, rounder shell shapes, and .ower growth rates that can reduce susceptibility to predation (Appleton & Palmer, 1988; Trussell & Smith, 2000; Leonard et al ., 1999; Trussell & Nicklin, 2002; Hollander & Butlin, 2010; Bourdeau, 2010).


修改


用 “可以降低捕食的易 感性 ”代替 “可以降低 捕食的易感性 ”

将 “ 产生 ”改为 “ 导 致 ”


用 “特定的猎物表型 ” 代替 “特定的猎物表型 ”


解释


使用更简洁的动词, 更好地表达原意。


使用更准确 、更简洁的动词, 更好地 表达捕食与贝壳形态之间的因果关系。


使用更准确的形容词, 更好地表达原 意


提升段落间逻辑和连贯性指令


<^∙.√⅞^λ


指令 : 请分析以下文本 中每个 段 落 中 句 子 之 间 的 逻辑 性 和 连 贯 性, 指 出 句 子 之 间 的 流 畅 性 或 关 联 性 有 哪


些地 方 可 以 改 进, 并提 出 具 体 建议, 以提 高 内容 的 整 体 质 量 和 可 读 性 。 请 只提供 改 进 后 的 文 本, 然 后 用


中文列出改进之处 。 请改进以下文字:


原始文本


修正后文本


Over the past several decades, with the explosive growth of renewable energy, Over the past several decades, renewable energy has seen explosive growth, and large-scale energy


large-scale energy storage technologies allow replace traditional energy. High-performance most promising candidates for large-sca technologies. Since commercialization, lithium mainstream energy storage devices with thei density, and long cycle life . In order to me improving its electrochemical performance, materials that provide lithium-ion batter performance, while providing high capacity an in-depth research and discussion. As a promis alloy-based anodes such as silicon (Si, 4200 theoretical capacity, nearly 10 times higher graphite anodes (372 mA h g-1). Unfortunat from large volume expansion/shrinkage during leading to the formation of cracks, separation collector , and disruption of the electronic electrode,ultimately resulting in a sharp dec attenuation of cycle life. ln order to overcome


intermittent renewable energy to


storage technologies have played a


orage inte.rmittentntbatteries:are one of th


i


e



y


a


Koutput voltage, high energy知,outputivoltage, high energy densi esstrong demandforfurther生行Nevertheless, , to meet the incr earch ⅛ for sustainable anoderesearchers have begun to explore ith safe IE and stable cyclic 。简only ensure lithium-ion batteries ahnvdoidltaatgeefcourravneos,dehamsastpearrikalesd进彳4ca2p0a0cimtyAanhdgh-i1g)h vhoalvtaegsepcaurrkveeds.i ahndgi-d1a)tesfhoorwaneoxdtreemmealtyerhiaiglsh,4ex2t0re0mmeAly hhigg-h1t)h, ehoarveeticsaplacrakpeadcii 1the capacity of commercial (372 mA h g-1).

these types≡oyf moatceorimalssrucffaer论,D( espimte theigr po).tential, these , alloy lithiation/delithiation process,亍了their large j volume expansion and tive material from the £ currentresult in the E formation of crack ductionnetwork within thedisrupted electronic conduction n


vital role in enabling intermittent renewable energy sources to gy. Among these technologies, high-performance secondary ising solutions. Lithium-ionbatteries (LIBs), in particular, have orage devices since their commercialization due to their high , and long cycle life.

sing demand for even better electrochemical performance , ustainable anode materials. The goal is to find materialsthat not have a safe and stable cyclic performance, but also offer high mong various options, alloy-based anodes, especially silicon (Si, -depth research and discussion. This is primarily due to their , which is nearly 10 times that of commercial graphite anodes


based anodes have significant drawbacks. The main issue lies in hrinkage during the lithiation and delithiation process. This can active material separating from the current collector, and a


these problems, previous research


has put a lot of effort into improvingelectrode durability.


Therefore, much of the previous res to overcome these problems.


rk within the electrode. All of these issues can cause a sharp hortened cycle.

rch has focused on improving the durability of the electrode


标点符号错误一键修改指令


指令 : 请 你 帮 我 确 保 以 下 文 字 中 的 标 点 符 号 正 确 无 误, 如 果 发 现 标 点 符 号 错 误, 请 将 你 发 现 的 错 误 列在 一 个 两 栏 的 标 记 表 中, 将 原 文 放在 第 一 栏, 将 更 正 后 的 文 本 放在 第 二 栏, 请 只 列 出 错 误, 并在 最 后 提供 更 正 后的文本 。


原始文本


ln addition. theleft valve of each mussel was examined for


compressive force (shell strength)following Burnett and Belk (2018). A universal material+testing machine(MTS System Corporation, Eden Prairie, MIN, USA, Model 661 ; Fig1,)was used to determine the shell strength. Each shell valve was placed horizontally with the shell edge on a flat surface , while a compressive force was applied at a constant loading rate of 10 mm-min until the real-time force curve on the monitor screen fast drop indicating failure occurred.


修正后文本


ln addition, the left valve of each mussel was examined for compressive force (shell strength)following Burnett and Belk (2018) . A universal material-testing machine (MTS System Corporation , Eden Prairie , MN , USA , Model 661; Fig . 1) was used to determine the shell strength. Each shell valve was placed horizontally with the shell edge on a flat surface, while a compressive force was applied at a constant loading rate of 10 mm/min until the real-time force curve on the monitor screen fast drop indicating failure occurred.


改写降重指令


指令 : 我想让你充当科研写作专家, 并提供一些英文或中文段落, 你的任务是用原文改写段落 。 你应该使用 人工智能工具 (如自然语言处理) 、 修辞知识和你在有效科学写作技巧方面的专业知识来回答 。 请只提供改 写后的文本, 不作任何解释, 请用科研语气风格重写下面的文字:


I want you to act as an expert in scientific writing, I will provide you with some paragraphs in English or Chinese and your task is rewrite the paragraph in the original language. You should use artificial intelligence toolsr such as natural language processing, and rhetorical knowledge and your expertise in effective scientific writing techniques to reply. Please only provide the text after rewriting without any explanation. Please rewrite the following text in a scientific tone:

Our study demonstrates substantial benefits of multispecies plantations, which corroborates and generalizes findings from forest BEF experiments (14,16, 21) and helps to show their implications for real-world forestry aoDlications. Our analyses offer Dredictions that αo bevo∩d

Qr 圃巳藤厦思学(用时28眇)Y

This Investigation establishes Stgnrficant ecological advantages associated with multispecies plantation systems, empirically validating and extending foundational biodiversity-ecosystem functioning (BEF) principles derived from controlled forest experiments (14,16, 21) while demonstrating translational r&levance for silvicultural practices. Our predictive modeling framework reveals critical limitations inherent in conventional BEF experimental designs characterized by randomized species composition and temporal constraints, thereby underscoring the necessity for implementing extended experimental frameworks employing deliberately curated species assemblages to elucidate biodiversity-mediated temporal dynamics in ecosystem productivity.

© C O Q


我想让你充当科研写作专家,并提供一些英文或中文段落,你的任务是用原文改写段落。你应该使用 人工智能工貝(如自然语言处理)、修辞知识和你在有效科学写作技巧方面的专业知识来回答。清只提 供改写后的文本,不作任何解薜,请用科研语言风格重写下面的文字:

为了更加清晰的了解捕食者的捕食模式,研究者们引入了捕食周期理论描述捕食者捕食过程中的捕食 行为.这一理论可以清誰的表述捕食过程中捕食者是如何搜寻、攻击、捕获和摄食猎物的(Holling1 1966jO›Brien,1979jWong, 2005).基于这一理论,捕食率可以被拆分为一系列行为概率:捕食者和 猎物的相遇概率、相遇后攻击概率、攻击后捕获概率和捕获后摄食概率(Hollirlg,1966 O'Brien, 1979).这些相遇行为可以与捕食选择(主动选择与被动选择)联系起来.


$ 图已深度思考(用旳26秒)V


为系统阐释捕食者的猫物获取机制,学界通过捕食周期理论对捕食行为序列进行建模分析(Holling, 1966; O'Brien, 1979: Wong, 2005).该理论框架将捕食过程解构为四个连续阶段:猎物搜寻定位、攻击行为启 动、猎物捕获实施及能量提取完成.通过概率集建模方法,总捕食率可分解为若干连续行为事件的概率乘 积,具体包括捕食者一猎物空间相遇概率、遭遇后攻击决策概率、攻击成功概率及最终撮食概率(Holling, 1966; O'Brien, 1979).此类■化行为参数为解析捕食策略选择提供了数学模型基础,特别是主动选择偏好 与被动机遇捕食的机制区分.

<d C 心。


解读文献配图指令


指 令 : 这 是 发 表 在 【 杂 志 名 称 】 期 刊 上 的 一 篇 论 文 题】 。 作为该领域的专家, 请帮助我解读该图 。


中 的 一 幅 图, 标 题 为 【 文 章 标 题 】 , 图 例 为 【 图 的 标


IEEEXIccess

—♦■“I **wMow> ,“<■— I⅜


Receded AUgUSt 31,2019, accepted September 2019, date d PUbbCatiOn Septeenber 23,2019r date okunent ve,iαn October 16.2019.

r⅜ιa^ ohm 5M ICUK>a^CJMEzMWH

Variable-Based Spatiotemporal Trajectory Data Visualization Illustrated

JlNC HE,, HAONAN CHEN ,. YIJIN CHEN', XINMINC TANC1, AND YEBIN ZM…

ISChDd of lcv∏Mιvn and C<∙πvnskmkπl TqIlshuB lEE>ty- Beιιπ< l<<M4. 0um

j<⅛llr*r N <⅛manκc «*! Surwrywg Fι<iπtvm<. Cw* UIWVeIt7 «t Mm>⅞ arai TEumlnsr # R«i,p RCijinB HMKlll. Chuu

'SaIrIIitr Surrtjatf ant ^<4fψ∏y A^>br4tw∙ Crateκ. NatHvMl Λ⅛aιπa#rst*vi M SWVCyp. MappiQ and G*n*α(cππιa*ι<*n ŋf Oiiikl Bajι∏ KMlkMt.Ctem

4IntMituIc <# C<>aψuiMg Trc⅛nι⅛ιn, ɔiiarʧ AcMinm M XICWW Rojwg MMII⅞K Chi*

4Univrratj <# CHMr< Z3ππy M Scwmt*. HGK KMDWi Πmπb

*Beijtβf (2j□WAY SUltaaK CFMay LM1 Rcijing KUMl,Cl)in4

C<Mic5patMfcnf author IhMaumChcn ,1Mrmɪnθ XtIldGLeMDtth^dun)

ThB ruuteriiil B biv<ιl un WGtl MiPpUrled by ιht CUIhuUj Eλpeπ⅝ and Four BiMkhe¼ pɪufeet untkr GraDl Nυ. 201S5M0 IM), ∏u* Irk ∙8 peιformc<J al and *upputled by the SChDUl u( Jut*na⅛‰m and CcinniunacabtJn. Iluighuu LlMVCnaty and thr CtJlqge Ut Gcubciβ⅛ce and Survc)'nf EInCeTei& Chm l⅛ι>vr*ιιy of Minmg and Tcvhnolnp-Bcιιng



FICIMf 1. ConceptiMl co∙nMriMn among InUiIMilnemiofMI InuIthreriMe. HnUiIir∙be ∙nd mUltbcale (a) MuItidBnetuionaI: DO. 10r ID Mid 3D; (b) muMv*tet*: ScλI.. 2∙tuy>⅛ Jmd n∙tu^te; y mu*ivdu∙: Seii— 2∙tug)lβ and n*tMpte; (d) multiιc^∙: Hilι resolution ∙d low molution.


新对话

This is a figure from a paper published on the journal of [IEEE Access] with the title[Variable-Based Spatiotemporal Trajecto<y Data Visualization Illustrated] Jhe legend of the figure is [FIGURE 1. Cor>ceptual comparison among multidimensional, multivariate, muItivalue and multisc∂le. (a) Multidimensional: OD, 1D, 2D and 3D; (b) muKivariate: Scalar. 2-tuple and n-tuple; (c) multivalue: Scalar, 2-tuple and n-tuple (d) multiscale High resolution and low resolution.]. Ptease help me to iπterpretthe figure as an expert in that field.

y æ已*度息尊(用时56眇)ʌ

Okay. I need to interpret Figure 1 from tħis IEEE Access paper titled "Variable-Based Spatiotenipofal Trajectory Data Visualization Illustrated." Tħe figure is a conceptual comparison of muKkiimensional, muHivanate, multivalue, and πultiscale. Let me start by recalling what each of tħese terms generally means in data visualization and spatiotemporal contexts.

Firstl multidimensional (a). The figure shows OD. ID, 2Dr and 3D. Multidimensional data usually refers to data with multiple dimensiorιsl like spatial dimensions (xl y, z) or other axes. In spatiotemporal data, time ts often a dimension. So OD might be a single pointv ID a line (like time series). 2D a plane (Eaybe IaUtude and longitude)r and 3D adding height or depth. This part 1$ probably about how data can exist in different dimensional spaces.

Next, multivariate (b). The figure mentions scalar, 2-tuple, and n-tuple. Multivariate data involves multiple

DeSeek发送消息

倒号度总学旧幫  ⑥裁网搜索                                         QJ ■


论文参考文献格式指令

................................................................................................................_

指令 : 我 想 请 你 担 任 一 份 研 究 手 稿 的 参 考 文 献 编 辑 。 我 将 为 你 提供 五 个 参 考 文 献模 板, 你 应 将 其 作 为 指 南 。 之 后, 我 会 提 供 更 多 参 考 文 献, 你 需 要 检 查 这 些 参 考 文 献 的 格 式 问 题, 如 标 点 符 号 的 位 置 和 间 距 。 给 出 一 个 包 含 三 列 的 标记表, 第一列是原文, 第二列是固定文本, 第三列是解释, 然后提供所有固定的参考文献 。 以下是需要修正的


五个示例模板和参考文献:


TempUte:

1 Apple<on RD. Pilmer AR Z988) Water-borne stimuli released by predatory crabs and Ctamaged prey induce more predator-resistant shells in a marine gastropod. Ptoc Natl Acad Sci USA 8S4387-4391

2 Blbby R. Oeafi-Hardlng R Rsdle S, WWdkcmbe S, Splcef J (2007) Ocean ∙d⅛mcaH8 disrupts induced defences in the intertidal gastropod Uttorhia Httorea. Bid Lett M99-7O1.

3 OiWe JM. QritfiW KR. S∙n,o<fd E (20Tn IndUoWe Wenses in OympU OySge M response to an mv&sive predator OeCOlOgia 18^809-8t9.

4. Blumtlein OT1 Danι∙l JC, SprinQMt 8P (2004) A test of Ihe multi`preðator hypothetic r&ptd lost of aπtιprθctat0f behevxx after 130 years of ooUtian. Ethok>gy tK>91θ-934.

& Bonsdorff E (2006) ZOOtMnthlC diversity∙gradients in th∙ Baltic S∙aι Continuous PoSV ggaJ succession in a stressed ecoβyιt∙m. Journal of ExperimenUI M*nne Bt&ogy and Ecology 330:383-391

Re*∙noe π∙etf∙d Improv#

Boullis A, Fassotte B, Sarles L. Lognay Ga Heuskin S. VandefPianCk M. βartram S. HQUbrUge E. Franctt E VorMggen FJ (2OT7 Elevated Carbon Dlo3>∙ Concentntioft Redues Alarm Signaling in Pll(K J Chem Ecol 43∙164-E

Bourdeau PE (2010) An inducible morρhctogιcal defence is a passive by product of behaviour G a marine snail. Proc R Soc B 7ΠA55-462,

Bourdeau PE (2011) Constitutive and IndudMe defensive traits in co-occurring maπ∩e snails ðisthbuted across a vertical rocky tmefl(d∙l g Functkonftl Ecology 2STΓ7-18S.

Brdnmarlc C, Hansson L-A (eds) C20t2) ChemiC √coiogy In aquatic systems Oxford UnhMrtIty Pren, Oxford; New York.

Brdnmark C, Lakowitz T HoHanCtef J (20T1) Predatof-induced mocpholog4cai PuSljCity across local populαbom of ∙ freshwater sn*ιl. PLoS ONE 6:«21773.

Burnett NR BeIk A (20Compressive strength o< M/tdus CaMOfrMBnuS ShelI is t⅛τ>e-dependent and can ιπHυence tħβ potential foraging strategies σf predators. M&r Bol 16S42


原始文本


Boullis A , Fassotte B , Sarles L ,LognayG , Heu skin S , Vanderplanck M . Bartram S , Haubruge E , Francis F ,Verheggen F(2017 Elevated Carbon Dioxide Concentration Reduces Alarm Signaling in Aphids. J Chem Ecol 43:164-171.

Bourdeau PE(2011) Constitutive and inducible defensive traits in co-occurring marine snails distributed across a vertical rocky intertidal gradient. Functional Ecology 25:177-185

Brnmark C, Lakowitz T Hollander J(2011) Predator-induced morphological plasticity across local populations of a freshwater snail. PLOS ONE 6:e21773.


修正后文本


Boullis A, Fassotte B, Sarles L, Lognay G, Heu skin S , Vanderplanck M . Bartram S , Haubruge E, Francis F. Verheggen FJ (2017) Elevated CarbonDioxide Concentration Reduces Alarm Signaling in Aphids. J Chem Ecol 43:164-171.

Bourdeau PE(2011) Constitutive and inducible defensive traits in co-occurring marine snails distributed across a vertical rocky intertidal gradient. Funct Ecol 25:177-185.

Bronmark C. Lakowitz T,Hollander J(201 1) Predator-induced morphological plasticity across local populations of a freshwater snail. PLOS ONE 6:e21773.


高阶数据分析指令


! 指令 : 请 你 制 作 1 0 个 不 同 的 可 视 化 图 表, 以 反 映 上 传 数 据 集 的 各 个 方 面 ? 适当加上一些对你的数据的描述 , : 尤其是各个列 (变量) , 这里尽量详细的描述你的数据]






口用 10张精美的绘图 , 展示数据变量之间的关系或潜在的分 析思路 , 包括展示数据分析的直方图和箱线图 。

口呈现关键变量之间的配对散点矩阵图和小提琴图 , 以及常 用的相关性热图等 , 每张图都有详细的解释 。


其他常用英文指令


Prompts (指令)

描述

Prompts (指令)

描述

Can you load and preview the data?

加载,预览一下数据

Can you list the top 10 key points?

最重要的十个要点

What are the trends shown in this data?

找趋势

Can you describe the data?

描述数据

Show me the top trends in a visual format.

以视觉形式显示趋势

Can you clean this dataset?

清洗数据

Can you create a heatmap using this data?

创建一个热力图

Can you segment this data and create a table?

切分数据

Can you create a graph using this data?

制作一个图

Can you create a world cloud?

做一个词云

Can you create a chart using this data?

画一个图表

What are the rows and columns in this dataset?

描述一下行和列

Can you make the graphs more beautiful?

把图美化一下

Can you write a one sentence recap of this data?

快速回顾一下

Create a visual chart, based on this data.

做一个视觉图表

What’s the main takeaway from this dataset?

找出最主要的信息

Can you explain this dataset like I’m 5 years old?

像给五岁小朋友讲故事那样解释一 下这个数据集

Can you create a presentation based this dataset?

做一个整体展示

Can you create 10 graphs to present different data?

创作10个不同的图展示数据

Can you write me an article based on this dataset or statistic results?

根据结果写文章

Can you explain this dataset in one paragraph?

用一段话来解释一下这个数据集

What insights do you see here? Give me a numbered list.

提供一些见解

Can you explain this dataset in simple terms?

用简单的话来解释一下这个数据集


其他常用中文指令


Prompts (指令)


跨学科融合: 将舆论分析概念与其他领域的最新具有突破性的理论深度结合,提出极其具有创新的交叉领域的十个问题 。


探索舆论分析概念的基础理论 、哲学基础或科学原理等深层次原理,提出挑战这些基础的前所未有的突破性十个问题 。


舆论分析这个概念在最前沿科技或理论中的潜在应用,列出十个充满想象力和震撼性,前所未有的应用 。


如果要量化研究审美智能概念,请提出一个合理的,有效的,各指标不重叠的,你自己能提取数据的指数体系框架,不少于三十 个指数 。


请大家研究任何问题,先用这四个提示词进行提问 。一是跨学科融合,二是深层次原理, 三是概念前沿应用, 四是如何量化分析 。 任何学术概念 。


里面会有些冗余信息, 可以删除回复中的冗余信息 。另外大家有空还可以对我的提示词进行改进, 围绕四个方面 。我们需要建立 一套研究提示词集 。


AI for research 提示词集 。



□何?


元知AI综述工具



元知是国内由清华 、北航专家团队研发的 个AI学术平台,目前其AI述生成工具已开放使用,能够帮助用户从海 :

I                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   i

I                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   I

L量文献中提取核心信息,通过自然语言处理算法,实现从文献梳理到观点提取到研究评论的一键式全自动生成。 J


功能亮点


□多版本与模块化支持: 目前提供三个版本(基础版 、增 强版 、专业版) , 能够灵活应对不同用户的综述需求 。 工具内包括文献观点梳理 、问题提出等功能模块,确保 用户在不同科研需求下得到充分支持 。

□增强版绘图功能: 增强版具备绘图功能, 可通过可视化 图示(如文献关键词共现图) 直观展示综述内容, 帮助 用户更好理解和呈现研究成果 。

□无数据检索: 以现有真实数据库作为支撑,通过关键词 检索, 自动搜集相关文献并生成综述报告, 目前只支持 英文检索 。


□低重复率: 结合现有查重机制与AI技术,在内容生成阶 段引入重复检测与优化策略, 从源头上降低重复率风险, 所生成的综述普通重复率与AIGC重复率均在5%以下 。

□无限双语数据导入: 支持中文与英文文献的导入, 并且 文献数据量没有限制, 能够轻松处理中文文献的系统性 梳理, 以及国际文献的跨语言分析 。

□幻觉克服: 以现有真实数据库作为支撑,借助由专家设 计撰写的提示词,精准规避AI生成中的幻觉问题 。

□高规范格式输出: 所生成的综述文档格式规范 、结构清 晰,符合学术论文标准,用户几乎无需进行二次整理 。


中科院PubScholar平台


功能亮点


产品概况



“PubScholar ”平台是由中国科学院开发 的公益学术平台, 整合了国内外多种学术 资源 。该平台提供文献检索 、引用分析 、 文献推荐等功能, 用户可通过平台高效获 取科研资源, 并生成相关的综述报告 。平 台的优势在于其广泛的数据源和智能化的

L文献推荐系统,支持跨学科的文献分析。 』 ;


□免费开放使用: 所有用户均可免费访问,注册后可直接 使用 。

□海量学术资源整合: 包含约1.8亿条学术元数据, 涵盖 科技论文 、专利文献 、科学数据等多个类别 。超过 8000万篇资源可直接获取全文,包括2122万篇论文全 文和5878万篇专利全文 。

□无数据检索: 以现有真实数据库作为支撑,通过关键词 检索, 自动搜集相关文献并生成综述报告, 支持中 、英 文检索 。


知网研学平台


功能亮点


产品概况



“PubScholar”平台是由中国科学院开发 的公益学术平台, 整合了国内外多种学术 资源 。该平台提供文献检索 、引用分析 、 文献推荐等功能, 用户可通过平台高效获 取科研资源, 并生成相关的综述报告 。平 台的优势在于其广泛的数据源和智能化的

L文献推荐系统, 支持跨学科的文献分析 。


□较高格式规范输出: 根据学术规范自动排版, 生成符合 论文要求的文献综述结构 。


□中文内容丰富: 在中文文献的分析上具有优势, 能够详 细呈现中文领域的研究成果, 用户可手动选择想要分析 的50篇文献 。


□无数据检索: 以中国知网数据库作为支撑,通过关键词 检索, 自动搜集相关文献并生成综述报告,仅支持中文 检索 。


斯坦福STORM



斯坦福STORM平台是由斯坦福大学的oval团队开发的的 款AI科研工具,其核心功能是通过多智能体协作,实现 I

L从提纲到段落再到文章的迭代式生成,为用户生成内容大纲及高质量长文本。                 


功能亮点


□资料整合与文章生成: 能够浏览网络,搜集大量文献 , 并通过基于主题的多个智能代理,将这些文献转化为连 贯的文章或研究论文, 长度可达数万字 。

□模拟对话与问题生成: 模拟文章写作前的调研过程,通 过发掘话题研究中的多样视角,模拟具有不同视角的作 者向话题专家提出问题的对话,并基于这些对话整理收 集到的信息来创建文章大纲 。


口转化文献为连贯文章: 可以将现有的文献资料进行分析 和整合, 转化为逻辑连贯的新文章, 为学者和知识工作 者提供了极大的便利 。

口多智能体协作对话: Co-STORM模式引入了协作对话 机制, 并采用轮次管理策略, 实现流畅的协作式AI学术 研究 。


用户体验对比:


使用步骤


整体来看 ,元知AI综述工具提供了一键式的自动化流程,只需导入数据 ,即 可自动生成高质量且规范的文献综述,适合快速高效的研究需求。


元知AI综述工具


7


PubScholar平台


元知AI综述工具官网: http://118.31.250.10:8081/#/

> 选择版本:根据需求选择工具的四个版本,包括基础版 、增强版 、专业版(单图) 、专业版(双图) 。

> 文献导入: 用户可从现有文献数据库中下载中英文数据后导入平台 ,或直接通过实时联网访问免费数据库 进行在线分析,操作简单便捷。

> 信息提取与分析: 平台自动运用AI技术对导入的文献进行关键信息提取和深度梳理分析,用户无需进行复 杂操作,等待平台处理完成即可。

> 综述生成:根据智能分析结果 ,平台自动生成结构化的文献综述文本内容和可视化图表,用户可直接获取 完整的综述报告,也可根据需要进行自定义调整,如综述主题 、目标 、参数等 。


7


PubScholar平台官网:https://pubscholar.cn/

> 输入关键词:进入官网后,在搜索框键入关键词进行文献检索。

> 选取文章: 勾选想要分析的20篇文献。

> 综述生成: 点击生成综述,等待2-3分钟即可下载综述报告。


知网研学平台


7


知网研学平台官网: https://aiplus.cnki.net/sumup/sumup

> 输入关键词:进入官网后,在搜索框键入关键词进行文献检索。

> 选取文章: 勾选想要分析的20篇文献。

> 综述生成: 点击生成综述,等待2-3分钟即可下载综述报告。


斯坦福STORM


斯坦福STORM官网: https://storm.genie.stanford.edu/

> 选择模式:进入主页后,用户可选择STORMCo-STORM模式。

> 输入主题:直接输入主题词后,STORM开始进行信息检索和文章生成。

> 查看生成过程 :点击“See BrainSTORMing Process ”,可获取不同LLM Role的头脑风暴过程。

> 参考其他文章:在“发现 ”栏,可参考其他学者生成的文章及聊天示例。


用户体验对比: 可操作性





元知AI综述工具


界面直观:平台设计简洁 、直观,使用户能够 方便 、快捷地进行文献数据的导入 、分析和综 述生成,操作路径清晰,交互体验流畅高效。


模块分区:将功能模块与信息展示分区设计布 局,用户可以轻松找到所需功能,提高了操作 的便捷性和效率。


多语言支持与定制化设置:语言支持对于国内 研究者更为友好 ,能够适应综述撰写的国内外 研究需求, 同时定制化设置满足用户在个性化 需求下的使用。



知网研学平台



□界面直观: 平台设计简洁 、直观, 使用户能够快捷地进行文献数据 的检索 、选取和综述生成,操作 路径清晰,交互体验流畅高效。


□语言支持: 支持英文和中文内容 生成。


__________________√

PubScholar平台



界面直观: 平台设计简洁 、直观, 使用户能够快捷地进行文献数据 的检索 、选取和综述生成,操作 路径清晰,交互体验流畅高效。

语言支持: 支持英文和中文内容 生成。







斯坦福STORM


界面友好:操作界面简洁明了,用户容易上 手 ,非技术背景用户也能快速学会使用该工 具进行文献综述的生成。


灵活定制: 支持使用本地部署的语言模型, 为有特定需求的用户提供了更多灵活性。


实时演示:提供实时演示demo,方便用户了 解和体验工具的功能。


语言支持:仅支持英文输入和英文内容生成。




生成综述对比: 多维度对比

PS:使用感受会因个体差异而有不同,仅作参考


维度

支持篇数

格式评分

文献类别

支持绘图

提炼观点

元知基础版

不限篇数

4

中文英文

不支持

基础提炼

元知增强版

不限篇数

5

中文英文

支持

深入提炼

元知专业版 (单图)

不限篇数

5

中文英文

支持

全面提炼

元知专业版 (双图)

不限篇数

5

中文英文

支持

全面提炼

PubScholar

20

2

中文英文

不支持

未有提炼

知网研学

50

4

中文

不支持

未有提炼

斯坦福 STORM

不限篇数

3

英文

不支持

基础提炼


生成综述对比: 准确性与专业性


PS:使用感受会因个体差异而有不同,仅作参考


A I综述平台

元知AI综述工具

PubScholar平台

知网研学平台

斯坦福STORM

数据来源

依托真实且可靠的学术数据库, 确保文献数据的准确性与可信 度, 为综述内容的真实性提供 坚实保障

涵盖全球科技论文 、专利文献 、 科学数据 、学位论文 、预印本 、 图书专著及开放资源

中国知网数据库 ,涵盖海量的 中文文献

通过必应搜索引擎收集数据, 确保来源的广泛性 ,但主要依 赖互联网主流来源 ,可能包含 推广内容, 需进一步筛选和验 证

文本更加贴近学术综述, 内容

文本倾向于事实现状, 内容包

文本类型

涵盖了研究现状 、简要评述和

文本较为学术, 内容涵盖引言 、

文本贴近学术综述, 内容涵盖 了引言 、研究现状 、参考文献

括历史背景 、当前趋势 、应用

主要参考文献 ,结构完整,生

各层面的分析 ,总结与展望 、

领域 、挑战与局限 、未来方向

成文本适合辅助学术研究和论

参考文献

等 ,结构清晰 ,适合用于行业

文撰写

分析和趋势预测

参考文献数量相对更多 ,涵盖

参考文献20篇以内,涵盖国内

参考文献50篇以内 ,只涵盖国

生成内容引用了高质量的学术 文献和行业报告 ,参考文献标 注格式规范 ,支持直接点击标 注查看参考来源,便于追溯

国内外学术文献 ,参考文献标

外学术文献 ,参考文献标注格

内学术文献 ,参考文献标注格

参考文献管理

注格式规范, 引用的文献来自

式不规范, 引用的文献来自真

式较为规范, 引用的文献来自

真实数据源 ,确保内容的准确 性和可靠性

实数据源 ,确保内容的准确性 和可靠性

真实数据源 ,确保内容的准确 性和可靠性


生成综述对比:逻辑性与结构性


PS:使用感受会因个体差异而有不同,仅作参考


A I综述平台 元知AI综述工具 PubScholar平台 知网研学平台


斯坦福STORM


语言逻辑


语言逻辑清晰 , 条理分明 , 各部分之间过渡自然 , 逻辑 连贯 。在研究现状部分 , 按 照不同研究领域和主题进行 分类,逻辑性强


报告整体呈现出总分总的逻 辑架构 ,语言描述清晰 ,避 免冗长 ,使用简短的句子表 达复杂的信息


报告整体架构严谨, 以引言 、 技术原理 、应用现状 、技术 挑战 、未来展望等部分进行 层层递进 。语言中多使用中 性描述 ,客观呈现研究进展 与问题


语言逻辑严谨 ,条理清晰 ,各部分 之间逻辑关系明确 。在历史背景和 当前趋势部分 ,按照时间顺序和技 术创新进行分类,逻辑性强


通过逻辑排序 、层次化分段

和观点与事实的清晰区分 ,                             在写作前 ,系统会先生成详细的写

确保生成的内容符合学术写                           作大纲, 为文章的结构提供清晰的

作标准 。内容结构完整 , 包                            框架 。文本内容结构清晰 ,包括历

内容结构 括研究现状 、简要评述和主 内容结构完整,格式较一般 综述结构较为标准 ,在中文 史背景 、当前趋势 、应用领域 、挑 文献分析上具有优势

要参考文献等板块 。同时 ,                             战与局限 、未来方向 。每个部分都

研究现状部分围绕研究主题                           有详细的子标题 ,结构合理 ,层次

进一步细分为多个研究层次,                              分明

结构合理


生成综述对比: 完整性与全面性


PS:使用感受会因个体差异而有不同,仅作参考


A I综述平台 元知AI综述工具


PubScholar平台


知网研学平台


斯坦福STORM


文本长度


文本长度较长, 内容丰富, 涵盖了多个研究领域和研 究层次 , 提供了详细的分 析和评述


文本长度中等长度 , 内容 较为丰富 , 也分了多个层 次进行总结


文本长度稍长 , 内容丰富 性在中文文献的分析上具 有优势 , 能够详细呈现中 文领域的研究成果


文本长度适中, 内容精炼, 重点突出 , 适合快速阅读 和理解


研究视角集中 , 从研究主


研究视角


研究视角多样 , 从不同领 域和研究层面出发 , 提供 了全面的分析和评述


研究视角多样 , 从不同领 域和研究层面出发


研究视角多样 , 从不同领 域和研究层面出发


题相关的历史背景 、当前 趋势 、应用领域 、挑战与 局限 、未来方向等方面进


行深入分析


生成综述对比:可读性与实用性


PS:使用感受会因个体差异而有不同,仅作参考


A I综述平台 元知AI综述工具


PubScholar平台


知网研学平台


斯坦福STORM


生成的引用格式标准且规范,能 引用格式较为简化, 虽然能提


引用格式较为标准, 尤其在中 文章语言类似维基百科风格,


引用格式规 够清晰准确地列出参考文献 ,符 供基本的引用信息 ,但在一些 合学术出版的要求,确保文献的 细节上缺少学术规范, 适合较

格式符合高水平的学术标准 为基础的文献综述


文文献的引用上符合国内学术 出版的常见格式, 适合中文领 域的文献综述


具有百科的深度和结构, 可读 性强, 适合不同层次的读者阅 读和理解


自动生成 参考文献


能够自动生成参考文献列表,确 保引用格式的统一性,确保与文 中引用一一对应


生成的参考文献信息不完全, 且格式较为简化, 不符合学术 引用的标准 ,在学术规范方面 存在一定不足


提供自动生成参考文献的功能, 在中文文献的引用格式上比较 标准 ,能够确保格式的规范化


Co-STORM通过多智能体协作 对话生成动态思维导图, 帮助 用户发现信息盲点并组织内容, 进一步提升了综述的完整性和 全面性


综上所述,在生成综述的准确性 、逻辑性 、完整性及可读性方面,

A 元知AI综述工具依托于真实的学术数据库 ,具备较强的学术性和深度 ,尤其在学术研究领域具有较大优势 。其生成内容结构严谨 、内容全面, 并提供了有益的可视化工具,增强了综述的直观性与理解度。

> PubScholar平台在内容多样性和研究视角多样性方面表现良好,但引用格式和参考文献管理方面有待提高。

> 知网研学平台则在中文文献分析和结构化内容生成方面具有优势, 引用格式较为规范。

> 斯坦福STORM在行业报告的生成中表现突出 ,能够提供较为简洁且针对性的内容,适合行业趋势分析与快速阅读。


生成综述案例: 元知(增强版)AI综述工具


大语言横型传播偏向规制与风険治理:XChxGPT为例


1《Gh题関匸与Al传播上规制、理解与功能整合研究》


本次研究选取中国学术期刊网络出版总库CMKl和爱国科学精报研定所HnWtUleFm Scientific Information,I)Web of Science (WOS)鼠据库(时■间唸度选取有 20232024 4)作为fcj人点,分别度觑中英丈有效丈献20篇.17篇.



1研建主應美魅词共现量奏图谱


-,研究现状

】大语才越型传播J⅛触騎究甚面

交总关注.大笛扌IftH在不同知⅜⅛⅛⅞应用与J⅛i⅛. :春芋子(2024}提史.AX⅛⅛4∙ 语吉我学旬J⅛的应用便住自然语言处理,机盡学可干前沿被本才法拜知广芝庄恥从而促 遗学?者的扣识灰取与技範4将,蟬椎"合大养墊造.挙丹心足分坏段策噂忏力就度产生就 ⅛¾t⅛(7]. i⅛ftf t∞4>槌出,通城深:度洋习4tfl化久本摘要極型.井利好*讳■富 椎空实现足柄化席述JL成,有JSUt卄了鬱*文战的知识化戚齐水平,⅛flf≠4-⅛⅛⅛a⅛ 平范著提高四.却探才年 EHG提出.生咸为人工首能的皇書宏敏也其左枕弯頓娥*爆 度在用.牀促进我才主体关杀∙变.杯境却能升扬.責淞侏給创新学变革,进而助力人臭 救外与学习彩态的支塞[10],原君旧夺仁02牛訴由,大语古硬型在学本斬究中的应用盘 带来原加性.MiR管理与应用认同干价值,但皓拘,It与祀⅛⅞姓.局限丹迪版"无信就度难m 认冗、人机4也贵任划分不清,近而产生学术伦理不薦与研充者是⅜t⅛祀正化的风陰 [11].于千雯哥(i023)认为.AlGC投水在学来金丈生产中的应用脆布我油助作者相i⅛ *t 也可时也奉春了学术道應.我术局限布版权合城干问题,便患学水霸刊蘭爵西憫新的 ⅛L⅛ ⅛⅛⅛,零要从庄用.治理JM:莽握升三方面导求发液路径卩弱.徐敬玄手(202R⅛ .大语寸■S型的应用在学把出版中提高了效率和智⅛1化水乎,但同晴也引发了著作扰 能也,学*J⅛M, ⅛⅛⅛⅛⅛⅜∙fH*.因此中术出版犍构需加强人工置管和晚症世用 [13].塀扬{就123)提出.扳手平台姑设出应用推動了商可教育教学创新.通过引人大语 才携型手人工智能断我术,他化平吉何能,件⅛U⅛术应凡生成新的眠学肌事糧式.从而 ⅛⅛⅛Α≠^W⅛T⅛⅛⅛.⅛*f±⅛,假件会挙创新开坤斬情城.产生足:⅞fr⅞⅛t年变革故 ⅛[19].吴近军(2O23J认琴 « ChalGPT由代统的太语寸模里国展现出通用寿能.卸 Jffi支概误,通<7士术Jt带学祝角出虎,捕示了耳黑視生成<与意识毋态偏见七间岭因服美 騒.遷宀强调在A工普能时代..J⅛说弄F态批抖Ii分析的*舞姓R0]. TankwIe V CjoaM ⅛⅛. Jt語言模型在Web3D应用中姉集咸相伴旦著俄蓬内窖里咸、⅛⅛⅛∙J⅛i,个程 化昆肥投批合.但同时也杳来了恰理M■战,升为此領域未率外研究才仰握快了新毋说用 [21], Pestef A (2024)握出.大嗅議士模型在白搗語*St理翅域的突戒杜进晟威功应用 千:它凌夂等耳球境.这不仅将含然学尿财,^J*½⅜T<⅛⅛l5'⅜itS⅛⅛⅛⅛[2fi]. β0rnκh^rE÷ B (2024)认红 土里语后盘里的遥用鞋*1正著提升単复.治貯过程的数据整台 SΛΛA⅛⅛⅛⅛⅝∕⅛⅛⅛⅛

与法策.通电怀决軼据瞬L 语境理屏及伦理问題.4t⅛J⅛ t4S-⅛÷⅞⅛÷f ⅛ ⅛<ψ7]. HobensackM (2024)认:,畢崇大喪i⅛扌模型在护理实JV 拄宵M用密中的应用寿&足 於机遇,但*他用方栗鏑引*T计如偏见.遥用和詞證学伦理问共L从而造在了琏■速立评 .讦<.毋泡和頻南的持缝需求.以靖保耳适* æ4¢≠-⅛⅛*⅛⅛ffl[30]. Chen ZY

(2024}次为.ffi⅛⅛S⅛J-⅛⅛ O-LM)的快速发履,其在自然海扌处理领城的黄戴星


生成综述案例: 元知(增强版)AI综述工具


二、简要评述

当前研究在大语言模型传播规制,ChatG门\风险治理黨喀和传播偏向控制技术等才 而取得了显著进展,在传播規制方面,就第居展了人工理解与机器理解的内涵,探时了模 型技术对政治发展的影响.分析了技术认知差异,并提出了技未治理与伦理风陵应对策 喀.Q]fl風隆治理策唯研究聚焦于信息传播, 图书德处理和产业优化中的潜在风险 与应对■措施.传播偏向控制技术则关在差异化内容审查与暴力言论检测技术的提升,£实 风有害信息审查和用要环魔净化,但仍存在待解决的问類一 L理解力与伦理风险.当前研 先在探讨特定领域或技术的伦理风陵时,普遍存在对伦理I冋題的理解:笨度不:国的问题.研 究者往往对伦理风險的复杂性和多维性认识不峰全面,导致对潛在凡险的评价和莎測存在 偏差.此外,伦理风险的理解与实际操作之间存在脱节.研究者往往未能将伦理考量充分 融人研究设计.数据收集和分析过程中.进而期响研究結果的可会姓和可信度.2.我険治 理与制度不足.在风险治理領域,现有所完对风隆治理机制的探讨相对跳之系统軽.许多 研究倒支于单一治理工具或茎喀,而忽视了风隆治理的整体性命动态性.此外,现有的风 險治埋制度往往未能充分考虑蹄学科.跨领域的协同效应,导段在应对复杂风险时缺支行 效的整合和雖调.同时,制度设计的潜后性和对新兴风险的违应性不足,也是当前风险治 理研究的重要不足. 3.传并偏差与审奎挑战.在年息传播餌城.研究菁遍面幡若传播偏差 和审查挑战的问题.传播偏差可能导致信息失真,影响公众的认如和决策.当前研究对传 描偏差的识别和评牯方法相对有限,难以准确捕捉和量化信息传播中的偏差.同时,审查 机制的存在使理研究者面临数据获取和声容表达的限制,影响了研究的全面性和客现性. 此外审查4⅛提的篁杂性使用研究者推以在保证研究持量和遂守审查親定之间扌UR平衡


三、主要参考文献

[1]周支君,郭斌生成式人工智能传播中的偏向与规制——以ChatqpT.为例口学习与实 ¾j 2024p01i 33-41+2.

⑶肖峰,大模型的理解力之争与理解现新叔事[几社会科学2024, 01,415L

[3]高寸输,大摸型时代的复合平等与国事主权一从沃尔泽出发的思考川.天津社会科学, 2024. OL 3+47.

[用喻国明,苏芳,金丽萍,缺席的对话:大语言模型的认知想象与差异弥合四 现代出版 2424. 01r 20 35.

[5]韩晚宁,周恩泽.能力跃升与战喀重构:生成式人工智能驱动媒体深度融合的路役探析 汉 中国 ⅛⅛2024, 02, 29-35.

冋王铮静,叶鹰,王婉标Q^gFLAI^GPT 米应用对图书馆信息处理的变項析卩L 困书億理论与实践,2O24jO1, 122-127+136.

[7]郑春萍,于森,郭智规.人工智能在语言教学中的应用研覚:回域与展望卩],冲错教学, 2024. 01(45}, 59-68.

(8]高阳,通用人工智能提供者内容审查注意丈芬的证成0].东方法学,2024, 01, 189-2∞.


生成综述案例: 元知专业版


(单图)AI综述工具


伕空语言模型的绰肅域应用与桃践分析尊法

本次研究逸取中国学术期刊同鳍出版总率CXKI和美国科学情报研究所 (Dιstitute∙ft>rSCienfific Infomiatiaii. ISI)r⅛⅛ Web'Of-Scietice (WOS)敷据埠 f时闸绅 ⅛⅛Jt ⅛ 202 3-2024 )作为財入点,分制荻我中英丈有效工城川疆17 ⅛=-



1崂克*J⅛■H*flt聚用凰i*

一、研究Ja糕.

S国外T龙观秋.

L人工智髓诂士機型的演看与实Svfl覓展而

聚焦话言模型演避啷完,辭*人工智能赵文主介桁領J⅛的应用堆总,提什i⅛ 言麗解扱零,拓履智能更互顧域。立点关注大型语言模型在犀星和推荐任分中的 应用潜力廣真俾髄的枪理新却学科合作桃底.BontIKhaeB (2024)提出.大型活 ⅛⅛⅛⅛⅛⅛过根中通过增張款据整合.沟通加預剧能人使得时夏⅛⅛ 5.过程的 理解得到沃化.,从而改进就概登动的决策制定与嗑床实践,尽管刃而伯提减.但就 代表F康复領J⅛⅛⅛生大追步,界强谓丁企理使用科跨专业合作的更要鱷USl≡ R <2024>速氏,通过蹲学科各作.责任庭时、就声举指、可料镂实践和育款治理 来拉咕大煙模扣小规模语言模型的发质,使得这些鼓术能妙长远地造福于社会


聚焦大⅛L摂语言模型选展喷龙,解决智龍分折与舞学科应JH难关,优化扣祝 本合机制,革新决策支持系统.重点关注大型逶言模型在各做段中的应用潜力与 ⅛⅛,法工幫可毒竹提升,专业4t应用、指令⅛t化展跨模态理解等方面的研究进 ⅝. Asproni a C2024付沦了大型语言模型的可观襲性.翡出速一挣性的重要性 在于它詫有就空溺和分析模型行为,从而提升模型的呼靠性和性能HJ, zhoug∙Y024表明,銹金価版专业数据势和实时K捷的大理涪言模型能倍■克服通用模型 的易曜性.从而援供更为专业的税务咨询速証,这一方法不杖提升了决能辅助能 力,还推动了领域特定人机交互的遡步,存放虺展示了大型语言模型在现实专业顿 姆中的应用潜力[5]ShilrY2024提出,没计出:⅛⅛H字太型语言模型生成 有害回春的三秤提示类型.这些授示经过验时公开可睥⅛⅞大型语言模型fL13in∏'2^70b , GPT'3.5-Tuιhonst∏lct, CLaude^instanM DOk) t 使得其研究成 果为提升模型⅛¾可信度及无害性评估提供了重要指导回.Pester A ⅛2024表 明,大型语言模里的成功把舍显著提升了沉浸式学月环域的及果.便龄在用各整育 教学原則的同时,对现行我育系统的效能产生租械影喻.界国技表的进歩而优化了 .I二)国内阿定现状”

L一生成式人工智能应用与实践飞变层面

聚焦生成長人工智能探索,解决传播讓区与霊管摩悬,it除成更与芋求規 花。支点关注生成式人工智能我来的发展及算帝来的偏见风1⅛与秆业姦%.多位 学哀找调厉止偏向、技表⅛⅛合.内宸审查机制及法律鞋架完善等重要就題0周瘦 君等2024认力.尽管CmtGPT通过强大的"逐优能力"实现了信息传播技札的 突破,也由于見剣人类社会的醫見和外部費本及政治影响,使得其在转播过程中可 ⅛⅛¾⅛⅛⅛, ⅛⅛⅛⅛⅛⅛J⅜⅛t因此速証在训练敷据和撲里遥计中防止伪尚.并 通过行业和制度力量引导善城康建展[]司.桶説宁等2024)认为,生成式人工智 Ife推动媒体在技.札和商业领域实現融合,为媒体蛆窺等来宾喀垂钩的机会,使Jt在 管理品維、产品创新和社会消理方面増强意等优势,但同时也要求媒体撲升对技术 風戀的把程意识[19]■,高阳¢2024)更誕.通用人工智能提供者座通过轩合技术将 点的内察审查机制∙⅛行注意义务.京预防有害信息的佬収風際,因⅛-W数据


生成综述案例: 元知专业版

2j语言模型龙展与网靖軍查机制蜀莫层而

聚能太语言模型创新,解决认知厚可、部番阻力与卷用评估,提升理解与預 灌!效陡.圭点笑注大语言模型在理解力、政治芻吶*社会认知、教育应用、学术 噺觉与由版、语言处理以現意识無态等多方而的挑践和机遇。⅛›⅛2024讨论 了人工智能大模型是否具有理解力的问题.症议通辻更新理解明以堂舍人本主支与 ⅛⅛iX.从而更好地解析大擁型的理.解方,并促.进人机互讣与合作的新型理解现 的用成[27].高奇埼2024认为,大摸型作为亞塑性力量在国内和国际政治中引 发不确定性,使得在国内政治中合理分配与创速者的原则至美史要,同时提汴在国 除故治中避更利用大模型追求新帝国主义目标,以防导致干涉上丈和竞争模式的复 非化已同。喻国明等¢2024)强调.大型i⅞言模型已引发社会时新技术的多元认 知,通过研究不同群体的小知差界,揭示与技札主体性相关的忧再和误解,并指出 保便率同群体时话有助于故动拄隶包向称合社会期望的方向发展口9],郑春萍等 2024认为,人工智能应用于语言教学,:过自然语言处理,玩鴇学习等前沿技

.二、周要评走                                     ,

同前美『人工智能语言模型的研堂取得了显著的进展.材别逝在语言模型演 强与实跟应用方面.研竞表明,大型语言摸型在解决工本分析应用难题、提升语言 理解数率及智能交互能力方面后巨大潜力,同时也推动了蜂学科应用.如廉货、推 荐系统.及护理領城.举若曲⅛⅛∙⅛理和隱学科合作的疑戒,这些模型根高了扣识融合 机制与决憲支持系统的性龍.国外学者特别美注模型可靠性、专注化应用、以及跨 模态理解的遼展.进一步推动了对其行沟分析及数据集特性的騎究.而在护理、 Web3D.施游等多樋国的研究中,模型的潛在应用帀发了新他理问題,强调丁评 估株准和指导方計的重要性.国内研究则聚焦生成式人工智能技表的踪管、1⅛SL凤 险以及促进教育和学术由板领域的创新,呼吁加强技术与伦理治理,比化亲际应 用"总的果范,当前研究不仪在技家应用方面展示了大語■言扌史型的变革性潜力,还 在伦理考量.跨学科合作及实琼应用中提出了而的耻战和发展方向,但仍存在待辞 决的问懇:"


(单图)AI综述工具

.(-)国扑盟元方面¥才舒决冃号;"                             .

L時学科合作与ifr理同趣仍需深入採/

见有制■充表明.人工帮龍,彻威府別是话守模型的应用:力不断旷展.但博学 科合作与伦理问題承然是需要課人括讨的美縫衩趣之L* Il ⅛,在岭学科合作方 而,日莉的所究虽埃初力孫汁了多韻版之冋的协作牌力.但尚未提供具体的实跟枢 黎以支詩这些跨頻圾应用的实越.此外,尽管有学君强消了多学科合作的重要性, 但如何有时地整合不同領域W专业Si"逝府蛮課以促进模型的部曾*忧化仍不好话 耐。与此同时.綻着甭言椎里在史多敝感栃成中的应用.其可相引发的伦理河礎会 加日篁,包括酔秘泄處.⅛⅛⅛⅛^以及或■任界■定等.然而.也有總理鼠在如何落 跷性地讳伝扣应Jj这些伦理向迟:画仍显不足,需要发戚史.魅身⅛⅛⅛ΛΨ⅛ft ⅛⅛⅛ ^ ^性強的指导准则.以期網tit ^■複型的应用科合人类社会的道^规范." .三、主要参考文献                         .

[1] Bouiiecbeie B, UIilOCkinF the' Black- Box?' AComprεħciisive-EKpIoralionr of Lar⅞tc, Laιιμiλge' Models' Iu■ Reh3bil⅛ation[J].j AMERlCAN∙ JURNAIJ。尸 PHYSICALMEDICINE &■ REHABILITATION.-202-1. 103(6):/532∙537. “

[2] ⅛haιr R. Language- AjiificiaI Intel!⅛e¾ce at a Crα⅛sma[⅛:- Deciphering the- Fnhire-of Small a□d LaIiD Language Modeh[J]. COMPUTER. 2024√5T(S);6-35.■

[3] He ZK. Xieι ZHJ Jha R. Steck" H/ Liang- DWFeug∙ YS/ NIajurnder BP. Kalliis N. McAuley J. Large Lauguage Models as jZero-S hot-C on vau⅛ational Recoiiiiiieiidet siC]. PROCEEDINGS 0F THE 32ND ACM INTERNATIONAL1 C ONFERENCE ON INFORMATION AKD KNOWLEDGE MANAGEMENT. CIKM >023∕202J, : 7 20-73Q, “

[4]' Asproni" G.' Phillip■ Carter' oπ- Obsavabιljy1 for LarFe-Lrii叫丹開 ModeIsfJ]. IEEE SOFTW,⅛RE∕2024√41(5 )?93-9 6 >■

[5] Zhong- Y. Wo∏E' D√ Lan K. Tas- IntclliaeDt Decision-Making' LangiiEige= Modd[J]. IEEE-ACCESS / 2024 √ 12; 1462 02- ɪ 4 6212.

[6] Slitii Y- Kiin SY.-B^mι EY. A- Study oιr Prompt- Tyφes- fbi'-Hannlessiiiess Asses aκeιιt of Laι⅜e-Ssus! e LftiigiLftge MQ(es[C]. HCE BNTERNATΓONAL- 2024 POSTERS. PT Ml,-HCII ∙2O24/2024.21202 2 23 *

[7] Pester Λ/ TanHiiari Λ. Giiti-匚「Steimnaιιι⅛r- A. Abou. EPS⅛ond- Si- Convei'sational Agents. 'Vutua Γ World s√ and" B eyoπd:- A Rer⅛ iew of LargH ^Laπgτι age^Modeh^Eπablιπa


生成综述案例: PubScholar AI综述工具


伏语言模型综述报告.

I引糸

近年来.大一音校壁(L"LanHUaBB∙M0KUMQH然拆,1处理預域侬色了显 的突破,JU“近的应用和深逑的彪响〃逐渐海透到a个行业利硏究领域.Xih:模型不仅 在传统的文本生成.瞅洋和理解任务中雇现田購越的性酷.还在众多实际应用场景1 Ir发挥 行重整作用,例如饮疗健康、金融板行、新用传媒及出版业等..

一貯肺究的深人.许翳学者开始探时火语占畏型在不冋練域和不同应用中的潜丿J。挑 时例如,在出版业.大诺方模型用觇作推动创《f的新引擎,使賜优化内容T.成和推荐系 编在新闻学裁域.实证研究拇示了其代信息采集和内容侧作中的优势*「価花医学正域. 基于大语言模型⅛⅛技术止花加Zj临床数据的解析与利用.此外,些研究述美让大语普模 里的安全性和伦理问题.例如越献攻击、信任建构及伦理沿理等..

然而,大沿言模埸井『定美无嵯.其在实际应用中仍面临一系列挑战,如模型的微 閥、融合北他技术(如国神经网絡).以及在特走领域(如中医州〕中的美越技卷与策 略.同时,如何弓I导大语言模型生成计算机"I解析的内容.如何任沙施话料的情漫.卜‘实现 高效的讲音转换.以反如何将儿应用『电竹研究等領域都是当繭研究的热点话翹■ +

春义冒花舞在大语大模型领域的最新研究进展和应用实用,-技术、成用和伦理一个 维度进行深入探讨.我们将重点关注丈语::模里的核心技术、其在胃个领域的应用案例. 以.及伴髄而来的伦理扣宜合间題,+

在接F来的部分中我们將详细分析各个「领域的研究或果.对比不同方法的优映 点,并展望大语J模型龄味乐发展史势和潜布应用..

z∙大语J模型概述

大语喜模型(Laree- Language ModeL LLM)是門前人1智能领域的Jft異册究方1句,通 过便用海依攵本敖据进扌行嘅.这型同型Mla理解和生成自热语言.处理加直本分终问 答、对话④弟种百用语d任务. H而全球著名的大语言携型包括GPT, L3MDASaa等, 然而.尽管大语言模型在存个领浴都屬现出了强火的能M 做也存任如内容幻疝、价优观 储位、歧视/上等问题,因此如何正确引导护也用大语话模里成为『一个了变问题.InU

2Q24年的m鑑论文对大语占模型进行了概法,强谓广其在人1判能领域的亜要性以及 其在处理多种件朝语看任务卜一的能力i仑文喇关注了大语苫模型4洞闻筑域的慮 用.讨 了其对薪闻业、新闸生产、智能传播、传播模式等的注/和消极影响.突出了火


6总站,9J展堂

人语得校卷(UM)作为近第来Fl然语}处理上域的技术哭破,得到了广泛的型注和 硏咒.IL核心阶势在「能够通过大规模皺据训练,捕获丰富的语文信息.从而在名钟任势 中展现出◎后的性能。"

近期的研究3a小.大语7校型.不仅在传统的文本生成.域傩矶摘要号任务屮表现优 秀.还被广泛应用干出版.新闻、医疗、金融嘴去个顿域.倒如,花出版业,大语言模/ 假视作推动创新的新⅛i撃;在新開学领域.突证研究揭乐『其在信息检噱和内容生成中的 消力。此外.基于大i⅛百模型的技术也在医学旅域取得了显普进艇,如提供更夕故的数据 責爾服务、促进知识图谱问答等..

一而,雨若火语言模型的广泛应用.一带来了 ■系列的挑放.其中.安全性同题尤为 突出.如何避觉模型披感就攻出. ⅛m在保证性能的同时魏保模里的可控性和可Am牲. 都是当前研究的热点.此外,模型的伦理治理、佳特£⅞⅛域如中医药中的应用.以及与其 他技术如图神经网発俯(S含.也是未来独用探索的方向…

展県未来,火击人模里的研究和应用将更加深入和广利.行先,随汴技术的发展,■ 型的拨模和我柴度都释进一步提高.如何就化模型结构、提高训练效率将是关键.其次, 校皇的应川领域将道一拉T大,特别是耐呎疗、金鯉等垂直领域.大语,梗型疗里为行业 带乐革命性物变革.最后.模型.的伦理和安全何瑞将得到更多关注,⅛⅛保模型的鸣穿性和 翌正性将是研究的时要方向…

总之.大沿有模型正成为自一语才处理⅛⅛域的核心技术.其在各个行犯中的应用前疑 广福*飴台技术的4:断进步,我们期后大语;:控刑能为社会端来更多的抗优和机会… 7参考文献

[廿加喝h∙2024,大话入送型:出版业的恥:1.

2]麻敬宏囁如坤口024:上扎7限里和诘米学唤学卅咒V

母单选⅛∙W∕ J-刘肥储为,飞吗 工施必出&卫咏区忆五国望凍工因

4一次相;沼


生成综述案例:知网研学AI综述工具


本文由CNKI Al学术研究助手生成                        文献综述■专业版

大语言模型

摘要:本文献综述针对"大语言模型E的浜展背景.技木原理、应用現状及面临的挑敏进行了系统的橋理和分析 a S⅛,文章概述了大语言模型的发屜历程,井指出了进行该鏡域研究的必要性与背母0接君,深入探讨了大语 言模型的技术原理,并槪述了其在教育、医疗、金融等多个领域的城用现状,同时列举了敦育领域的应用品例、 医疗领域的应用案例以技金融领域的应用要例等,文章逐分析了大语言模型面临的技术挑战,井提出了深入学习 、跨学科研究以及创新思维的必要性作用研究方向的展望与建改。最后,总结了研究的主要发现和结论,并对来 来工作的方向提出了启示“

关键词:大语音模型、技术原理、应用现状、枝末挑战.未来展望

—.引言

1,1大语言模型的发展概述

在信息技裁飞速发展的今天,大语言模里作为人工智能領域的一親新星,正逐渐改变着我们技取知识、处理 语言和进行交流的方式。本文旨在综述大语言模型的发展历程、技术療理、应用现状以及面幅的挑戲和未来的甜 究方向,以期为该领域的研究者和实践者提也一个全面、深入的理解和参考,大语言模型的出现,不齎推动了人 王智能技术的边界,也为各行各业的创新应用提供了新的视角和工具。然而,殖赭技术的不断进步,如何确保模 里的安全性、公平性和可解释性,以及如何处理与之相关的伦理,隐私等问題"成为了当前研究的热点和难点。 本琮述将系琼地拨理这喳关键问题,井底望未来可能的研究方向和技术发国,以期为后续的研灾工作提供一定的 指导和启示.

U研究的必要性与背景

随着人工智能技求的快速发展,大语言模型作为其核心組成部分,已广泛应用于各个领域,如语言翻译、文 本分析、自然语言理解等。这些模型的成功应用不仅推助了技术进歩,也为社会势济发展带来了新的动力。然而 ,大语言模型的发展也伴随器技术挑教和伦理问题,如模型的泛化能力、解發性、以及数据隐私保护等0因此 ,对大话言模型的技术原理.应用现状、挑战与研究方向迸行全面摘理和分折,对于促进其健康发展、指导未来 研究方向具有里要意义。本文旨在通过对现有文献的系统综述,不仅总结大语言模型的发展历程和当前研究状态 .逐将指出当前研究的不足和未来的研究方向,以期为相关领域的研究者提供参考和启小


二、 大语言模型的技术原理与应用现状

Ll技术原理概览

本章节将姝速大语言模型的技术原理及其在不同殺域中的应用进展,大语言模型。 LMs I是近年来人工智隆領 域的一个重要分支,通过大■文本数据的学勾,这些模型能堪Ji理和生成人类语言,广泛应用于自然语毒处理. 自动写作、内容创作等任需.例如,陈玲和张潮QG5)1≡讨了 C⅛GPT在思想政治救臂中的应用,強遍了其条模 惠交豆.漫纵拟人化和人机连续协同的技术特征i此外,除盍和夏春旭(2024ɪ1将拜源有眼元软件OPenUS与大语 吉模型箍合,进行"■雄恂力学”戦字改革研究,通过这抻方式,学生腌翳更宜遮地理ft? ■梅力学"的黑本理论 ,井提升解决复杂工程结构间髄的能力-李通拓和齐向东整μ力财研究了大第言横型结遇数字人技术在医学科普 短视曲制作中的应用效果,评估了这种枝木的真实性感知、内容质量等方面,最后,孙光緒和王东波(如25上利用 大iB言模里技术分折了数字人文领球研究方法的演变超势η造些硏宽不仅履示了大语言模型技本的实际段用侨佰 ,t⅛反映了其在促进扣识传播.教学改革.科普教育等方面的巨大潜力.瑞上所述,大语言模型作为一种强大的 技术工具,其发展和应用前景值得我In进一步探素和期待。

三、大语言模型的挑战与研究方向

3.1技术挑战的分析

本章节集中探耿洁言横型在其发展过程中遇到的技术姚根*井分析这拦挑星对其幾展的影响b M早期的 Optn%心与大语言極型的结合应用|到对国家安金的新挑越,再到语言学领域的挑战与大语言栩型的互动,本节 格详细讨论这些技术挑出的具林内餐、 所面临的SS颗以及可能的解譲方冥。

首先,陈旌等0024}奸对"结掏力学"的教学改革研交中,指出学生在使用  Sm5ι⅛⅛等有限元分析工具时

,可能总遇到软件1*作、模里建立和参数设Bf等方面的困誰。这些技术挑战可能导致学生在学习过程中感到困礬 和挫败。为了血対这些挑岳.研究者提出了利用大通吉模型构建"结沟力学"学习助!手的方法,以实时解决学生 的个性化学习需求.

接着,在大语自模堂司国京安全的矢系上,莫宏怖(2024)分析了大语吉榛型绪国家安全帯来的新挑战,特别 是在載据安全、文牝安全和社会稳定等方面.这里扫由要求我葡市仅要保持高度警喝,还要在发展中谋求安全 ,以安全保障发展。

此外,石铎任0251探讨了大语言模型在语言字辅域均挑出,包括大语言学的概含、语言与思维的关系.语言 毋誉的机摘券,他强调了大语言握型对传统语言学理论的挑敏,岁及其在量学科.药领域研究中的应用前景.

毎后,徐SB跃和季吞挑口0中讨途了大语吉模型在古文=?研究中的应用,指出尽管大语言喔型在此领域喪现 还有待提高,但其强大的文本生成和处理能力为古文字的分析与理解提供了新的可能性,同时也带来了新的挑龍 .如犠型的准捕性和对专业知识的依親性等.

嫁上所述,大语音模型在多个领域的应用中展现出其理大的港能,但同时也面临着技术挑凶,如樣作董度、 安全性问题、理追与其踪的结吉等。未来的生展需要我们在保将其技术优势的同时,不断探索和解决这些挑as ,以充幻表挥大语言模室的应用潜力.


生成综述案例:知网研学AI综述工具


四、结论与未来展望

4.1研究成果的总结

经过对大语言模型领域的深入文献综述,我们可以总结出以下几点Wl究成果:首先,大语言模型在技术原理上 已經取得了显著的进展,尤其是在模型设计、训练技巧以及优化算法方面IJ其次,大语言模製的应用范国广泛 .涵盖了教育、 医疗、 金融等多个領域,显示出扱大的实用餅值和潜力.然而,这一领域也面临情诸多挑出,包 括技术层面的优化需求、模型可解释性、以及伦理和陰私问題等。


4.2对未来工作的启示

综上所述,大语言模型作为一种前沿的人工智能技术,其在多个領域的应用已经展现出巨大的潜力和价值。 本文通过对大里文献的回躁和分析,系统总结了大语言模型的技术原理、应用现状、面哈的挑国以及研究的潜在 方向.技术原理方面,大语喜模型通过大规模款据的学习,能翳实现语言的理解和生成,其复杂的模鸥将和学 习算法是其核心竞争力的来源。在应用现状方面,大语言模型已经被广泛应用于教育、医疗、金融等多个領域 ,不仅提高了工作效率,还创造了新的服彗模式和业者流程.然而,挑战与研究方向也同样值得关注,其中包括 技术的优化、模型的可解释性、数据的安全性等关键河题。

对于未来的工作,我们可以預跳,大语言模型的发展将更加注重以下几个方面:首先,深入学习的必蔡性将更 加黑出,研究者需要探索更高效的学习算法,以握高模型的学习能力和效率。其次,跨学科研究的必要性也将提 升,因为大语言模型的应用涉及到空个学科领域,需整跨学科的知识和技术进行综合应用和创新。最后,创新思 维的必要性是推动大语言模型发展不或或微的动力,新的算法、新的应用坊景以及新的业势模式都需要创新的思 维来驱动。


参考文献

■紫変超,普香沒只R佳叟.基于大语言模型的制度问答系统在基层央行的应用探索卩]金融科技时代■,2024, (1*47∙ 5口,

陈玲,米潮.ChaI叩大语言模型赋能思想政治教胃的特征、应用与原则避循[JI.语言与15育研究.250 ":39 44,

,陈未生,邹正阳,大语言模型在会计研究中的应用卩I中国注册会计师2024, (12):187 4+5.

■陈欣摩蜜如,周悦琦周同,强峰一基于大语言模型的道题电动生成路程研究⑴中国考试.2024r (12):39-48.

陈素,夏春旭,樊成.大语吉模型背覺下融合OKnSets的"结构力学"教学改革研究UJ科技风,2024, (36):112^ 114.

仇星月,陈向东階鸨/FB港萌.大语言模型支持的元鋅合研究:基于智詫体的方法山现代教育技术,2025, (01):63-72.

載情.基于大语吉模型的汉诗英谭人机共译模式探究一一以¢行路睢为例U]名作欣赏,励24 (3*12,

■邓情妮,雷佳乐.基于大语言模型的协作式两阶段考试国钱研究Ul电脑知记与技术,2024343■^3生 ,杜春娟.ehalGPT大语喜模型背景下的师生美系: 技术图景与人文向度Ul渭南師范学院学报2024,{口);65-72 "温蓓蓓.M文率到实践:大语言模里时代的知识生产与发展面向一以波普尔I三个世界F为思考椎架山现代 出版,2024, (12):67-7 8.

管童,焦永新大语言模型时代人工智能期能创意写作的教育亩思与实践展望[J]中国远程載育,204, {12):63-75.

,何零健,有乐之江实验室、 国家天文台携手出品天文大语言模型ʌsg (⅛≡正式度布川今日科技,2024,(12) AO. 胡叫欣,即向茉,张植波,张振里,黄領宏,陈輝涵,辛斯聪,饶新殻h字研.基于大语言模型的网络故障全周期管理系 统硒究0|广东通信技术,2O*J1⅛56-6L

化柏林,王英泽,大语言模型方法在情报实践中的应用山.科技情报环究,2025,(01):53-64.

■李洒韬,齐向东,大语言模型结合散字人技术合成垢視项在医字科普中的Ja果评价口|.组蛆工程与整建外科,20m, (0€} :643-547.


生成综述案例: 斯坦福 STORM英文版)


A Review of Research on Trends in Large Language Modeling

Table of Contents

summary

Historical Coriiext

Early Faunda'tions: 1800$ to EaHy 1⅛ODs

The Md-20th Cenlury: Theoretical ∏r50v⅛tic∏s

The Rise of Syrnibolic Meiho<j⅛: 198C⅛ aM Early l≡90¾

The Statistical Turn 1990$ to 2010$

The Deep Learning Revodulio∏; 201Q Onwgrds

Current Trends

Mo⅛el ActvanDements and BreakthncHjghg

The Surge of Jnteresl in LLMs

Ethical CcKisideraIions and Future DireCEk>r≡

Applicaticifis

Matural Language Pnocesstng Tasks

Content GefierBlion

Virtual Assistants and Customer InIeractiDns

Software Devdopment

CiistomEaIjon and Fiπe∙≡tuning

Challenges and Limi⅝aliQ∏s

rtaccuracies and Ha∏ucinati□πs

Complex Reasoning Challenges

Memory Lirriftetions

Cornputatianal Constraints

Ethical B nd Bias Consideralioris

Privacy nd Data Security

Future Directpons

Irwiovations in hΛodef Wsming

Addressing Ethical Considerations

Enhancing Model Interpretability

Energy Efficiency and Sustainability


Mullimodal and Multilingual Capabilitigs

Chec⅛ htBw⅛∙tQ∏τkqeEe.stsrιfc>rdLedιιlartic⅛J597194 for mere details

Stanfoncl University Open Virtual Assis^ιnt Lsb

The generated report can make mi¾takesi Please CoriSFiler checking importaπl in⅛rι∏atiori, The generated SEenI does not represent Ihe developers viewpoint.

summary

Large Leingusagg Mode(LLM?) τepreseπi Ir^nsformativie Clevelopcnerit in the field of Natural Language Processing (NLP) and artificial intelligence, characterized by their ability tα generate human-like text and understand complex language patterns. Emenging from adve∏iGerτ5- in deep leβr∏ir>g and Reunetwork erŋhileekɪres. PartiaJtariythE transformer model introduced in 2017, LLMs Eike BERT and GPT have set new benchmarks Iot various language understanding tasfics, reshaping WPPtic⅛ tiα∏9 in sectors 5uch 与写 customer SrVigK coπleπl ereatwn^ RnO eduGa⅛o∏.[1j[2Ji3] The ris@ erf LLMs has Parked uπprecθdeπled interest end investrnent, psrticularly following Ihe release of mo4els like ChiatGPT in late 2022, wħtch showcased lħe potential for LLMs to revolutɪθinize u⅛er interactions and enhance service delivery across industries.pi Howeverr this rapid evolulion has also raised critical ethical concerns, indmling issues Df bias, misinformatiDnB and the interpretability of model outputs, necessitating a balanced discourse on tħeir deplcsyment and the responsibilities- of dsvelopers and users alik⅛.[4]I5][6]

Moreover, while LLMs excel in various applications—from santimβnl analysis Io content generation—Ihey also face significant challenges. Limitations sudh as hnaccura-cies in □u4pu, oomρlex r⅞ascnrkg struggles, and eιlħical considerations surrounding data privacy and bias persist, iprompling ongoing research into SDutk⅛ns !ħat can enhance Iheirreliabilrty and ffairnes⅞.[7T5][6] As the landscape Qf LLMs continues to en⅛lve. the S&cus is i∏crea singly on addre&sing !ħe⅛e challenges and en⅞uring responsible mnovaliofi within lħis dynamit fi⅛ld-[81[9]

In summary, lħe oxρ⅞oralion Df trends in large Imngummodeling encompasses not only Hie technological ədveneerrienls 曰何 applications of LLMB bul slso ə criTical examina{i<χ of the ðlhieal and Operalional ChIlmg日匂 they POm白.As re$earch^r$ and practitioners navigate this rapidly changing terrain. Ehe discourse surrounding LLMs will Pley @ Pigial rŋie j∏ shaping Ih future Cff Al and i5 iπtegraiαr irto sociely.lfiJU

Historical Context

Natural Language Processing (NLP) has rich history thət SP∏5 several centuries, beginning with foun<j⅛liα∏al IinguisSic studies and waiving inlo mgdem compuitatioriel tβ⅞hnlquβ⅞. The M NLP 匕白才 be Irasd b白& t白言r⅞cint 吞小旧台话 βι白片 Panini in ancient India, wħo ∞ntributed significantly to Itie grammar of Sanskritr laying


Energy Efficiency and Sustainability

Given the substantial compulatioπal resources required for LL≡Ms, optimizing energy CCIngUmp<⅛n through techniques such as 8dsιp⅛ve precision tuning and My口目miu pruning is a significan! area αf exploration. This nαi only acklresses the cost implications but also Goiitribuies ID reducing the carbon IbDtprini: Bssociated witħ the training and ⅛ployment of these models^B]26].

Multimodal and Multilingual Capabilities

As LLMs Qonlinue to acfvance, enhar>cing 1ħeir CaMbil⅛es in handling mulliτκxial and FTiuIIiEingLiBl dalm will be Cr^caL The integration □f djvsr⅞B dt≡ types {sucħ Hm text, images, and a⅞jdi□} and supporting muHiple languages can tead: tα more vfr⅞atil6 and 白痴匕live applications 君。白酬 価自MW s⅛ctors. FUtLJrdβ√eloρn⅛nts will IlKeIy focus on achieving r0⅞3us⅞ness and adaptability tn lħε⅞β aspects, ultimately transtormirtg Hw u&IS interact with Al ⅛c⅜⅝o⅛⅞⅛sf4.

References


[1]: NLP ■ q⅛er⅛∙eiΛ, Compyter Sconce

Rj MmLtlEi ZnSusge pCo?3命虫小IKlPUijlm

[3]: HteIQcyXOfliucal LdnaOagLErOCSSIfla LSLtolaiSCIaclce

[4]; Regeni: A∏¾⅞⅞∏pes E LafgS Lvnguaqe Mod已也 f∏r HBajthM-MEJPt

[5|: EvolutiOn f LaixiLanqciacie MCKJEl □ka LLM nd ItS fulunB

HiSI□ry mnd El√cduhn f IMLFl - G⅛∙kzfarG日白*占

P]: A Eh⅞f Hl觥口rγ 5 L⅞j¾s LaiHt□u∕e “白〉已低-LghodCfl

8: NaLijral Laπguage^Prc^BS⅛ιπg <NLPj. A.CαrπplBte Gu.de] - Dθ⅞ple3rr.ng.AI

Γ9j. ≈..rJv^Unj r∙g !ιyι⅛ι>jτr-tκ∙y. A Ucuμ D >;u i∏Cu MLP'S IHHlrn"中"


[10]: J⅛T相詢IrrPKAKm 吟G览段 f⅛r N!” R吋飢MG


[1



Mr fιj¾elearning aEhiEg⅜⅛JFei - ⅛⅛i⅜up⅜dia


[12J: EQlubori f LaEE LandiiEqE KllcldElS■: Al JDUEe■■/ ThirDuqh ,Hustprv

[13FUmr⅜ CIfLHrge LaflgL卢口巳 McX1倒弓-∙Geek5⅜jrGeek

[14]15 ChIlene⅞ VVfth LmEe LanqlJ⅞α⅞ MWs fLL⅛⅛H BIg - FrIiCi⅛r

115J: RDCenLTrDnds in Uarga Language Mod⅛i⅛ - y!z.aι


^T6]. * >L-≡ V? JJYI Viiin [Jrfercncr::. r「」 “ MKwiIl L"hjeu "印:⅛∙⅛es f-d


[1 l⅛p 10 R⅛¾-Ufe Appii^^ηs QfL三乎 LnwI MGP^产廊.

[10⅛ 45 m□Lworicl LLM aρ⅜ρhca⅛or⅛ and USe ea舌< from top COEPar⅛a¾

[19]: IG ιg⅛st IJnniti□r⅛ IJf La Lngumτ MqdEiS ∙ PujectPrip

(2CUHUEl Bi円弓 ir Lanqe Language Mcdmv: A CDErII¾hE∏qive ArllalV⅞im mrιd ..

Z1Jj ⅛V⅛al i⅞ Aj Eltlie&?-M

[22U arqLe⅜πU口口店 Mndnls 11: HIClr⅜ EvohMiou *nd FUErc∙.- Sc∏^bl⅛ DaLa


生成综述案例:斯坦福 STORM(中文译版)


大语言模型趋势研究综述


■摘要

⅛i⅛pt⅛lfi (UM5)代•我展隰鼠'i吧平国卩 礼U:制齡啲沙变革性发陰.其 特点是能培牛喚类似人娄的文本,井理解岂務的语寸奥式『大谭:根灵源白謀度学习和神 经网解架构的it%价別足2017年可入的变压體匹型.做HERTGPT这样的UM己 昆为剂ti⅞育理解任%设漆『新的延准,R型/客户限务、内容创作和贵"等行业的应用

[11 [21 (31 ・ a

LLM的岷睥引题了JIBHkT兴躺H投资•福U⅛LM22年米发布的时论Fnf模里之 后,展示mMM能也吱或成用「』冠件提升作行业服步交拼端丿"4】「揣*通 快速演变輝引发门左步也出向性.包括偏见.虚收信电和模吋输出IFwl解择件阿忠•因此 需喪时![部*进刃T:「的时心同时用偶阡发荐可11用的式任【4[5] 16].

此外虽燃LLM任各种应川中表现丸将-从仙活分析到内容上成——它们μ面临朮K 號液,输出小淮端、良果推理困雁以及川逑故据您抬和修见的伦理问趨依然0伍.載 凰⅛e⅜sm⅛蹄畴喻綸蜀唯懒ft赫E【5[<1« ##ww* 4*叫心解决这些捕战并用保负责田⅛6算成如了日題哩的课r[幻[91.

总而言之.关于火16:需量也势的探讨不仅⅛⅛/LIM的技术进%和应用卜⅛t⅛⅛⅛ 申觇了它力所带來的伦理和操作性擋战,Iair研究人员和实践费花这 侬越变化的W潮中 前进.M⅛ LLM lfti∙r⅛⅛≡iδAI的来来及其与社会的融合中起到关勉作。[81 (101 ^


符号方法的凫起:19s0年代至1990年代初.

IU年代标志港.ME4⅛号方邮我盍时K, ⅞^^^^^^^^幣玄学#1语 义学的研籍而要的义辰包括対头屮动短语前树语法EPg的研督 以及:级形态学 的进展C这个时期述11fh:⅛汗估的朮恵件•体他中Cl期的聊天机器人.如軸eWjabberwaCkyfliJ .CHI:代也是NLP屮柩架系统弋同伽廿期.这融变在也上、* 度上整到『8文期即»关『悔嘱的工作罪响,他⅛S过这线框架表示典史的情蔑口?1 ■

统计方法的转变:1990年代至ZOID年代

im ⅛ftJFtfb NLP津渐转向统计厅法.W跳的i*i愿褪•如曜马,可丿灌型OiMM) H1≡横型■任借其对火股据生曲刊用相ft!式识別能力■逐渐占据k今他位,也限/ YfWh蜕则的索皖AW跟性门4[]5}.这宀时期也见证了神森网哥梨削ft用人.壊 ⅛WM⅛ fRNN)变得至)Ti豐.使蜂姓即评列義据.从而歎变了讲靑建模任务

(141 * -

深度学H革命:励Ia年至今

明如年代,源度学习的引入1!瞧革新了 NLP.米科济Λ iMiko]ɑv) X-f RNN ⅛ttfeHgj 记忆网肝(LSTM>L作提供了花烛坦権复舸?列的萨段,从而在翩译和文本生成等任 多中就得了突厥.此外,米科噌大等人任2013出的词帐入(WOre⅛mlmMi嘈› 方 法.掃並F词汇上血捐Lfi义关系.Il⅛H啜的方丸斑著l⅛面了整种NLPmHI的表现

[1SI [16].


■历史背景一

口然Fl处理LNLP)h菖%的历如藤縫门L令眦紀,始,IE础的i*T学研七遂抄

■褪为现代的i莫技术.NLP的根姑可以追常到3i代学示加占印村的帕尼心 他对熒0 语法的吏苴为计Jm高学方法会定fr£ (II .


当前超势一

大尺吉帙型(LLMf)里域起见证舒币汰的进展和创新.融鹼城了自黠语音处理(KLP) fllΑ.r⅛tE <ΛI)的多个力而一

模型进展与突破.

外近的发展突显了 LLM架构及其同用的两变. Jt H⅛ 2017年推出的变J鼠醞魄里,Mil门 注就力机制实现『并行处国 花Ml炼園度和衝M相比传统的琼加l⅛四热(RNN) ⅛T 极大的豐升:这一架构变也促进 NLLM的胤总其U咆火BERTGPT掣頁要枢 型.它小住矶才理解在畧屮设定U的标准【2(171 .


参考文献,

[1]∕NLlP--ro√e∏',iewf~Computer-Science-[2]^Natural1aπguagB-proce5sirιg-iWikipedi3∙.

[3]√HistoryOfjNaturaIaLanguage-Processing- LetrSjData-Science*.

[4]∕Rece∩tAd√ances'In-Large-Language-ModelS'for Healthcare--MDPh

[5]√Ev0utιon-of' Large∙Language-f⅛1odel-a⅝⅛a-LLMa∩ditts√Liture∙-

[6]?History'and<vol LrtionrOf-NLP--oGee^sforGeeks-.

[7]i*A*BriefiHιstQry of Large-LanguagebMQdeIs-*Liπkedln.

[θ]l∙Natur3∙La∏gu3gB-PrQcessiπgj(NLP)[A-C□mplete-Gijide]---DeepLearning.Alr^

[9]:-U πderstaπdi Rg-Transfoirners;-A4 DeepjDive-iπtα-N LP's^Technology'. [10]ijTDpjTr3nsfdrmer'ArchitedLre≡4ForNlp'∙Re5t3ckic∙.

[11]ι-Transformerι(deepιleaming'architecture)"-'Wikipedia^

[12]? Evolution,of* Large∙ LanguageaModeIszAr Journey rThrough-History.

[13]ι Future-OfLarge-Language∙lodeIs--*GeekSforGeeks~

[14]? IS-ChaIIenges-Wfth'Large<anguage"ru'1odelsr(LLMs; rBSog--ι Predinfer.

[15]: ■ Recent l'rends`in-LargerLanguage-Madefs--pgιz.ar


***附加知识***


DeepSeek+DeepResearch


基本知识介绍


DeepSeek颠覆出圈,霸榜热议


DeepSeek是一家专注通用人工智能( AGl) 的中国科技公司 ,主攻大模型研发与应用 。

DeepSeek-R1是其最新发布并开源的推理模型 ,擅长处理复杂任务且可免费商用 ,其性能 在多个基准测试中表现出色,对齐OpenAI-O1正式版,甚至在某些任务上表现更优 。

0r我是DeePSeek,很高兴见到你!

我可以帮你写代码、读文件、写作各种创意内容,请把你的任务交给我吧一

DeePSeek发送消息

j»Jl®m (RI) ®联网攫索                                       @


DeepSee k R1 引发全球关注

DeepSeek发布后在127日迅速登顶美国下载榜首;截 至130日,DeepSeek168个国家位居下载榜第一名。

OpenAICEO奥特曼承认DeepSeek的技术实力 ,并表 示将继续加快自身模型的迭代。

Meta立四个专门研究小组来分析DeepSeek R1的工作 原理,并基于此改进其大模型Llama

英伟达 、微软 、亚马逊等国际巨头纷纷接入DeepSeek


DeepSeek发展节点


2 0 2 3 年 7 月

D e e p S e e k 成 立


2 0 2 3 年 1 1 月 2 日 首个开源代码大模型 Deep Seek Code r发 布


2 0 2 3 年 1 1 月 2 9 日

推出670亿参数的通用大模型

D e e p S e e k L L M 包 括 7 B 和 6 7 B 的 base 及 chat 版 本


2 0 2 4 年 1 2 月 2 6 日

发 布 总 参 数 达 6 7 1 0 亿 的 D e e p S e e k - V 3 , 采 用 创 新 Mo E 架 构 和 FP 8 混 合 精 度 训 练 , 训练成本大幅降低


2 0 2 5 年 1 月 2 0 日


发 布 新 一 代 推 理 模 型 D e e p S e e k - R 1 , 性 能 O p e n A I o 1 正 式 版 持平 , 并开源


推理能力:核心突破,专项升级


DeepSeek R1 的核心突破在于其通过强化学习驱动的推理能力 。该 模型在训练过程中,通过强化学习技术 ,显著提升模型的推理能力 , 使其在数学 、编程和自然语言推理等任务上表现出色。


推理过程

DeepSeek R1 在推理过程中采用“深度思考 ”模式,通过展示完整的 推理路径来提高模型的可解释性和可信度。


推理能力

强化学习驱动: DeepSeek R1-Zero 是首个完全基于强化学习( RL) 训练的推理模型 ,无需任何监督微调( SFT )步骤 ,打破传统模型依 赖大量标注数据的惯例 。DeepSeek-R1 采用强化学习作为核心训练 方法 ,显著提升了模型的推理能力和语言表达的可读性。

推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模 型综合技能以外 ,还重点提升了模型在数学 、代码 、逻辑推理等硬核 任务上的能力。


思维链        推理         自我

展示   路径   修正


在生成答案前展示其推理过 程,让用户看到模型如何分 解问题并得出结论 。包括模 型对问题的理解 、问题分解 、 以及逐步求解的过程。


通过展示推理路径, 使得 用户能够理解模型的推理 过程 。推理路径包括模型 对问题的理解 、问题分解 、 以及逐步求解的过程 。


在推理过程中能够自我 修正,发现并修复之前 的错误 。这种自我修正 能力使得模型在处理复 杂问题时更加可靠 。


传统依赖:             创新思路:

大规模监督微调( SFT       强化学习( RL 驱动


推理效率

长思维链支持:DeepSeek R1 支持长链推理 ,能够生成数万字的 思维链 ,显著提高复杂任务的推理准确性,其长链推理能力在数学 、 编程和自然语言推理等任务中表现出色。

多模态任务处理DeepSeek R1 在多模态任务中表现出色 ,能够 处理复杂场景下的逻辑 、公式识别及自然图像等问题 ,显示出其在 多模态任务中的广泛应用潜力。


训练方法:数据冷启, 阶段递进

66 DeepSeek R1采用了冷启动数据和多阶段训练的策略,以进一步提升模型的推理能力和可读性。


冷启动数据

定义与作用:冷启动数据是指在模型训练初期, 引入的一小部 分高质量 、结构化的数据 。其作用是为模型提供一个良好的起 点,解决强化学习训练初期的不稳定问题 ,规范模型的输出格 式和推理链条,使其更符合人类可读性。

数据来源与特点这些数据部分来源于清理后的R1-Zero 输出, 还包括人工后处理的长思维链( CoT )数据 。其数量相对较少 但质量高,经过精心设计,具有良好的可读性和结构化特点。

对模型训练的影响 :冷启动数据为模型训练奠定了坚实的基础 , 使模型在后续的强化学习阶段能够更稳定地学习和优化 。它解 决了纯强化学习训练中可能出现的可读性差和语言混杂等问题。


多阶段训练



第一阶段: 推理 导向的强化学习

基于冷启动数据微 调 后 的 基 础模 型 , 进行大规模强化学 习 。 此阶段引入语 言一致性奖励 , 优 化模型在数学 、 编 程等结构化任务中 的表现 。


第二阶段: 拒绝 采样与监督微调

通 过 拒 绝 采 样 从 RL 检 查 点 生 成 新 的 合成数据 , 并与写 作 、 事实问答等领 域的监督数据混合 。 然后对基础模型进 行两轮微调 , 进一 步提升模型的性能 。



第三阶段: 全场 景强化学习

结 合 规 则 奖 励 (针 对推理任务 ) 和神 经 奖 励 模 型 (针 对 通用任务 ) , 对模 型进行最终的强化 学习 , 以对齐人类 偏好 。



降本提能:架构创新,技术增效


DeepSeek通过架构创新和模型蒸馏技术,在提升模型性能的同时 ,显著降低计算成本和内存占用。这些技术不仅在 长文本处理 、代码生成 、数学推理等任务中表现出色,还为大模型的轻量化和实际应用提供了有力支持。


架构创新


模型蒸馏技术


混合专家( MoE)架构

通过将模型划分为多个专家模块 ,实 现高效计算和推理 。DeepSeek通过 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平 衡的问题 。


多头潜在注意力( MLA)机制


通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力( MHA) 相当的性能 。MLA在训练中减少了 内存和计算开销 ,在推理中降低了 KV缓存占用空间。


DeepSeek采用模型蒸馏技术,通过将知识从大型复杂模型 (教师模型)迁移到小型高效模型(学生模型) ,实现性能和 效率的双重优化 。DeepSeek选择了多个开源模型作为蒸馏的 目标模型,包括Qwen 系列和Llama 系列




教师模型生成数据


学生模型训练


微调与优化


多令牌预测( MTP)

通过序列化预测未来多个令牌 ,增强 模型的上下文建模能力 ,并支持推测 解码加速推理 。MTP在特定场景下同 时预测多个令牌,提高信号密度 ,减 少上下文漂移和逻辑连贯性问题 。


FP8混合精度训练

混合精度训练,通过在训练


过程中使用更适宜的数据精度,减少


了计算量和存储需求 。FP8混合精度 训练在保证训练准确性的基础上 ,显 著降低了计算成本,使得大规模模型 训练更加可行 。


推理效率提升: 蒸馏后的模型参数量大幅减少, 例如 DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始 的DeepSeek-R1( 671B参数),计算复杂度显著降低。

性能优化:在代码和数学基准测试中,蒸馏技术显著提升了模 型性能 。例如,在基准测试中 ,蒸馏后的DeepSeek-V2.5模 型在Pass@1Length指标上均显著优于基线模型。


策略优化:开源特性,成本优势


DeepSeek采用开源策略 ,公开模型权重和技术报告 ,允许开发者 自由使用 、修改和分发其技术,促进了AI领域的创新和协作。

开源策略

DeepSeek R1 采用 MIT 许可协议开源发布 ,允许全球的研究者和开 发者免费使用和修改模型。这种开放策略促进了 AI 技术的普及和发展。


DeepSeek 通过技术创新和优化策略 ,大幅降低了模型训练和推理 成本,使其在性价比上远超 OpenAI 等竞争对手。


开源模型的优势与挑战


优势


挑战


可访问性

研究者可以根据自身需求 进行二次开发和优化

可定制性

允许研究者根据特定应用 场景进行定制 ,从而更好 地满足需求

社区支持

使其在学术研究和工业应 用中具有广泛的应用前景



可解释性和可靠性

需要采取措施确保模型的

可靠性和可解释性

社区参与

需要社区成员的共同参与 维护和更新, 需要较高的 社区活跃度和凝聚力

安全性

需要采取措施确保模型的 安全性和隐私保护


成本优势

训练成本: DeepSeek V3 的训练成本仅为 557.6 万美元 ,远低于 其他国际大公司的训练成本 。这种低成本策略使得更多企业和开发 者能够负担得起高性能 AI 模型的训练和使用。

调用成本DeepSeek R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元 , 输出 API 价格仅为 OpenAI o1 3% 。这种低廉的 API 价格进一 步降低了使用门槛。


模型

训练成本

调用成本

(输入/百万 tokens

调用成本

(输出/百万 tokens

DeepSeek-V3

557.6万美元

0.14美元(缓存未命中)

/ 0.014美元(缓存命中)

0.28美元

DeepSeek-R1

未明确(推测低于V3)

0.14美元(缓存命中)

/ 0.55美元(缓存未命中)

2.19美元

OpenAI GPT-4o

10亿美元

2.5美元(缓存未命中)

/ 1.25美元(缓存命中)

10美元

OpenAI o1

未明确

(推测高于GPT-4o)

15美元(缓存未命中)

/ 7.5美元(缓存命中)

60美元

Claude 3.5 Sonnet

5亿美元

3美元

15美元


测试评估: 对标顶尖,能力出众


推理任务表现


知识类任务表现


数学推理能力对标顶尖模型:DeepSeek R1 AIME 2024 基准测试中得 分 79.8%( pass@1 ), 略优于 OpenAI-o1-1217;MATH-500 测试 中,取得 97.3%,表现与 OpenAI-o1-1217 相当,远超其他模型。

代码生成能力达专家级水平: DeepSeek R1在编程任务中, Elo评分达 2029,超越 96.3% 的人类参赛者;在工程任务中DeepSeek-R1表现略优 于 DeepSeek V3,这对开发人员在实际任务中有潜在帮助。


教育类知识问答能力突出MMLU MMLU-Pro等测试中 , DeepSeek R1成绩超越 OpenAI-4o等其他闭源模型 。


其他任务表现


创意写作 、问答 、编辑 、摘要等任务中 ,DeepSeek R1 表现优异 。

非考试类智能处理能力强大:在 AlpacaEval 2.0 ArenaHard 中,


胜率分别为 87.6% 92.3%


IOO


DeepSeek-Rl Benchmark Performance


97.3


96.3 96.6


■■ DeepSeek-Rl

^H OpenAI-ol-1217

■i DeepSeek-V3



CIaUde>35

GPT-4o DeepSeek

OPenAl OpenAl

DeepSeek

Sonnet>1022

0513

V3

ol-mini

oV1217

Rl

Architecture

MoE

MoE

# Activated Params

37B

37B

# Total Params

671B

671B

MMLU wpim>

883

87.2

88.5

85.2

91.8

90.8

MMLU-Redux <em

88.9

88.0

89.1

7

92.9

MMLU-Pro 0Cl

78.0

72.6

75.9

&)3

84.0

DROP 0^αtFl>

883

«3.7

91.6

83.9

90.2

92.2

圧壬、面(PromptStnch

865

M3

86

M∙8

83.3

GPQA Diamond(1*^1)

65.0

49.9

59.1

60.0

75.7

71.5

SimpleQA (Can«n

284

38.2

24.9

ZO

47.0

30.1

FRAMES^ i

72.5

80.5

733

76.9

8X5

AlpacaEvalZO (LCfuuw)

52,0

51.1

70.0

57.8

87.6

AivnaHard cj,k-4∙uo6

852

80.4

85.5

92.0

9Z3

Liv υCtκie Bench ι⅛∙><ι Q)D

38.9

3Z9

362

53.8

63.4

65.9

ɑ B COdefonceS <f⅛Λvn⅛*

203

23.6

58.7

";4

%6

96.3

Ccxlefora** (IUiiM)

717

759

1134

1820

2061

2029

SWE Verifwd ‰m^i

50S

38.8

42.0

41.6

4SH

49.2

A idι∙r- Pol ygk>t iac*4

453

16.0

49.6

32.9

61.7

53.3

AIME 2024 <nι

16

9.3

39N

63.6

792

79.8

Math MATH∙500<ι&聞}

783

74.6

90.2

90.0

%.4

97.3

CNMO 2024«PD

13.l

10.8

432

67.6

78.8

CLUEWSC w

85.4

87.9

90.9

H9.9

92.8

Chinese C-Eval(km>

767

76.0

865

68.9

91.8

C-SimpkQA(c?™t)

554

587

68Q

W,3

637


本地部署:灵活高效,协同优化


DeepSeek的本地部署在性能上表现出色, 能够满足不同应用场景的需求, 尤其是在端侧和端云协同场景 。通过合理的 硬件配置和优化策略, DeepSeek可以在本地环境中高效运行, 为用户提供强大的AI支持 。


端侧部署能力


端云协同优化


DeepSeek 在端侧部署中展现出较强的适应性和灵活性 。


模型轻量化


硬件兼容性


DeepSeek通过蒸馏技术优化小模 型( 1.5B/7B/8B/ 14B/32B/70B 参数规模) , 使其在本地部署中表 现出色, 适合存储和计算资源有限 的端侧设备 。


支持英特尔 、英伟达等主流硬 件 平 台 , 并 可 通 过 AnythingLLMOllama等工 具实现PC本地部署 , 保护数 据隐私的同时满足定制化需求 。


离线能力


DeepSeek的本地部署与云端计算相结合 ,实现高效的计算和传 输。例如,其蒸馏模型在端侧SoC(系统级芯片)上的表现 ,显 著降低了硬件门槛, 同时提升了用户体验。


任 务 分 配 与 负 载 均 衡



实时性

在端侧设备上 , DeepSeek 能够满足实时性要求 , 例如 在智能家居 、 自动驾驶等场 景中 ,推理延迟低至毫秒级 。


DeepSeek 支持完全离 线部署, 适合网络条件 受限的场景(如工业物 联网 、偏远地区) 。


?


据 传 输 与 延 迟 优 化


模 型 更 新 与 协 同 训 练


对比优势: 高性价比,技术普惠


66与国内外顶尖同类产品比较, DeepSeek践行强化逻辑推理( R1) 与长文本效率( V3) 的差异化技术路线,其在性能和 成本方面展现出色的性价比, 尤其在训练成本和开源透明度方面具有明显优势 。


公司

模型

产品类型

核心功能

优点

缺点

DeepSeek

DeepSeek R1

开源推理模型

复杂推理 、数学解题 、 代码生成

逻辑推理能力顶尖;

开源生态支持自定义;训练成本低

长文本生成能力弱于 V3

工程类任务上稍逊于OpenAI O1

DeepSeek

DeepSeek V3

开源大语言模型

多语言处理 、长文本生 成 、代码生成

MoE 架构效率高;长文本处理强; 中英文混合场景优化

在推理能力上稍逊于R1

在特定任务上稍逊于OpenAI O1

OpenAI

OpenAI O1

闭源推理模型

复杂推理 、文本生成

企业级 API 生态完善;

多模态交互流畅;开发者工具丰富

训练成本高; 闭源且费用高昂; 中文支持弱于本土模型

OpenAI

GPT-4o

闭源大语言模型

多语言处理 、文本生成 、 创意内容创作

全模态能力行业领先; 实时交互响应快;商业化成熟度高

训练成本高;运营成本高 数据隐私争议大

Meta

Llama 3.2

开源大语言模型

多语言支持 、内容生成 、 信息检索

完全开源免费;社区支持广泛; 多语言基础能力均衡

多模态功能缺失; 长文本生成质量不稳定

Anthropic

Claude-3.5

闭源推理模型

对话系统 、内容生成 、 逻辑推理

对话逻辑连贯性强;

伦理安全性高;文档分析能力突出

中文支持较弱;

闭源且 API 访问受限

百度

文心一言

闭源大语言模型

多语言处理 、复杂的语 言理解和文本生成

中文场景优化最佳;

多模态搜索整合;本土行业适配性强

国际竞争力不足; 上下文窗口较小


革新技术标准:低本高能,开放共创

“ DeepSeek的成功促使AI行业重新审视技术应用与发展方向 。其低成本 、高性能的模型为AI技术的普及提供了实际 范例,推动了AI技术在训练成本 、模型效能和开源生态方面的新标准的形成。



创新技术路径


重塑定价逻辑


Dee p S eek 通 过 算 法 优 化 与 架 构 创 新( 如 MLA Mo E 结 构 ) , 将训练成本降至行业 1 / 10 , 打 破 了 传 统 A I 巨 头 依 赖 “ 规模法则 ”的垄断局面 。 其 F P 8 混 合 精 度 训 练 和 开 源 原 生 F P 8 权 重 , 显 著 降 低 了 中小团队的技术门槛 , 推动 AI技术民主化 。


Deep See kV 3 模 型 以 5 5 7 . 6 万美元的训练成本 , 实现了 与 G P T - 4 o 相当 的 性 能 , 生 成 速 度 提 升 至 6 0 T PS 。这 种 “ 低成本高性能 ”模式不 仅 挑 战 了 Ope n A I Google 等巨头的市场地位 , 还迫使 行业整体降价 ( 如字节豆包 降 价 8 5% ) , 重 塑 了 A I 服 务 的定价逻辑 。


推动研发转型

D e e p S e ek 的 全 栈 开 源 策 略 ( 模型权重 、训练代码均采

M IT 协 议 ) , 吸 引 了 全 球 开发者参与 , 形成了强大的 社区生态 。这种开放模式加 速了技术迭代 , 削弱了闭源 巨头的技术壁垒 , 推动全球 A I 研 发 从 封 闭 垄 断 向 “ 开放协作 ”转型 。





C2



重塑产业格局:打破桎梏,

DeepSeek R1 的全球影响力正在重塑 AI 产业格局,特别 是在中美之间的技术竞合中 。同时,也为全球 AI 产业的发 展提供了新的机遇和挑战 。

中美技术竟合

DeepSeek的创新不仅打破了美国AI产业的技术壁垒,也为中国AI产业 在全球科技竞争中提供了新的突破口。

DeepSeek的成功推进中国AI产业的发展,同时也促进了中美两国在AI 领域的竞争与合作,推动全球AI技术的多元化发展。

DeepSeek的横空 出世 给美国科技市场带去 巨大冲击 受其影响,美国芯片巨头英伟达的股价暴跌17%,博通下跌17%, AMD下跌6%,微软也下跌了2%

DeepSeek的应用程序在苹果应用商店的下载量一举超越了 ChatGPT,荣登免费应用程序排行榜榜首。


竞争活跃

活跃市场竞争

DeepSeek的崛起改变了AI市场的竞争格局,促使国际科技巨头加快 技术创新的步伐,加大研发投入,推出新的模型和应用, 以应对竞争。


Ope n A I


上线新一代推理模型o3系列的mini版本,并首次免费向用户开 放其基础功能 。o3-mini专注于数学 、科学和工程等领域的复 杂推理任务,其性能和成本效益均优于之前的o1系列。


谷 歌


发布新一代Gemini 2.0系列模型,包括Gemini 2.0 Pro Gemini 2.0 Flash Gemini 2.0 Flash-LiteGemini 2.0 Flash Thinking, 旨在提升AI能力并提高性价比。

全球AI产业链升级

DeepSeek的崛起带动了全球AI产业链上下游的发展 。其低成本高性 能的模型降低了大模型的投资 、开发 、运营成本,推动了国产AI芯片 、 云平台 、操作系统等产业的发展。


技术深化: 突破局限, 能力提升


“ DeepSeek R1展示了强化学习技术和算法创新在 AI 领域的巨大潜力,但其仍然处于发展阶段,存在一定局限性和优化 空间 。未来, 随着技术的不断进步和创新, DeepSeek R1 可能会在以下几个方面实现进一步的突破:


通用能力提升

目前,DeepSeek R1在函数调用 、多轮 对话 、复杂角色扮演和 JSON 输出等任 务中的能力不及 DeepSeek-V3 。未来, DeepSeek计划探索如何利用长推理链 来增强在这些任务的表现。


优化提示工程



解决语言混杂问题


DeepSeek R1当前只针对中文和英文进行 了优化 ,这可能在处理其他语言的查询时导 致语言混杂问题 。DeepSeek计划在未来的 更新中解决这一局限。


软件工程任务


目前模型对提示较为敏感 ,少样本提示会持续降 低其性能 。因此,建议用户使用零样本设置 ,直 接描述问题并指定输出格式,以获得最佳效果。


DeepSeek-R1 在软件工程基准测试中的表现未能 显著超越 DeepSeek-V3 。未来版本将通过在软件 工程数据上实施拒绝采样或在强化学习过程中引入 异步评估来提高效率。


场景拓展:创新推动,垂直深耕

DeepSeek R1将通过强化学习和多模态融合等技术手段,进一步提升推理能力 、优化语言理解和生成效果,并拓展在复 杂任务中的应用边界; 同时,将深耕垂直领域,如教育 、金融 、医疗等, 为不同领域提供更精准 、高效的解决方案 。


技术创新推动


垂直领域深耕


多模态融合

Deep Seek 未 来 可 能 会 在 多 模 态 融 合 方面进一步探索 , 将自然语言处理 、 计算机视觉等技术更深度地结合 。


具身智能探索

与机器人等硬件深度融合 , 实现物理 世界的智能交互 。这将拓展其在工业 制造 、物流配送等领域的应用 。


自进化系统构建

通过自动合成训练数据 , 持续迭代 模型能力 。这将使其能够更好地适 应不同垂直领域不断变化的需求 , 提升在各领域的应用效果 。



Dee p Se ek 已 经 在 医 疗 辅 助 诊 断 方 面 有 所 应 用 未 来 有 望 进 一 步 医疗领域 深 化 , 如 通 过 流 程 优 化 , 提 高 诊 断 的 准 确 性 和 效 率 。 通 过 与 医 疗 设备的结合 , 实现更精准的医学影像分析和疾病预测 。


金融领域


未 来 ,


Dee p Seek 可 能 会 进 一 步 拓 展 到 金 融 风 险 防 控 、 智 能 投 顾 、


金 融 产 品 创 新 等 领 域 , 通 过 深 度 分 析 金 融 市 场 数 据 和 用 户 行 为 数 据 , 为 金 融 机 构 提 供 更 全 面 、精 准 的 决 策 支 持 。


目 前 Dee p Se ek 在 教 育 辅 助 方 面 已 经 展 现 出 独 特 优 势 未 来 教育领域 可 能 会 与 在 线 教 育 平 台 、 教 育 机 构 等 合 作 , 开 发 更 多 个 性 化 的 学 习 方 案 和 智 能 辅 导 工 具 , 满 足 不 同 学 生 的 学 习需 求 。


法律领域


工业领域


Dee p Seek 在 法 律 文 书 处 理 方 面 已 经 具 备 一 定 的 能 力 。 未 来 其 有望进一步拓展到法律咨询 、 案件预测 、 法律知识图谱构建等领 域 , 为法律专业人士和普通用户提供更便捷 、 高效的法律服务 。


Dee p Seek 在 工 业 质 检 智 能 化 方 面 已 经 取 得 显 著 成 效 。 未 来 其 可能会进一步拓展到工业生产流程优化 、 设备故障预测与维护 、 供 应 链 管 理 等 领 域 , 提 供 更 高 效 的 工 业 生 产 和 运 营 的 解 决 方 案 。


DeepResearch 智能协作, 自主研究


「 核心功能 」


• M-ΛUffUtRtd

F^ CKi BnttMcedc 1½ OptfJU ff!90^W

• En 公恥 WA Xmi^X*Γ

♦ m⅝m SfTtimr

• ImMliw

araaRM4 fttαtλ英簡晚&稚HnB«14.


多步骤自主研究 、端到端强化学习 、深度信息整合



文本 、图像 、 PDF


1.多步骤 自主研究


输入 提示


调整

优化


2.端到端强化学习


3.深度信息整合


查找、分析 综合数百个 在线资源



解释 、推理


以研究分析师的水平 创建一份综合报告


11em K^frH

2 ■岂了鼾—m-08rW妙隗期U■耳 Ilfi. KOpenMmi

4 iM≡n Hfl∙*flU16⅜t!

R Fm IU人承ICCO E MC咄船与WeNIMWlI齐恥1-2/ 冃鼻”,OAIHfIiMMI, βiHfIl ⅜n RtHlAM O⅝nt>M 2KR^fl

1 KHWiITX.

贓髓餘 WαφχmβW1MWMI1.


FigUre机器人公司退出与OPenAl箫物N的原 因即*分析   ‘


端到端强化学习、规划执行多步伝实时调整策略 训练    骤研究流程/回溯修正错误



文本


图像


PDF


Text Text Text

引用 ”


实际使用 图源@宝玉


ChatGPT 中, 选择「message composer」 中的 deep research 并输入 查询

可以附加文件或电子表格, 为问题添 加上下文。一旦开始运行, 侧边栏将 显示所采取的步骤和使用的来源摘要。


【多格式数据】


支持搜索多格式数据, 整合多模态信息 ,生 成带引用和思考过程 总结的报告


基准测试:精度提升,


行业领先


表现: 人类终极考试, 准确率突破 26.6%


GAIA测试


这项测试包括3000多个多项选择题和简答题,

涵盖了从语言学到火箭科学 、古典文学到生态学的100多个学科 。


Model

GPT-4c

Accuracy (%)

33

Grok-2

3.8

Claude 3.5 Sonnet

4.3

GeminiThinking

6.2

OpenAI o1

9.1

DeepSeek-RI*

9.4

OpenAI o3-mini (medium)*

10.5

OpenAI o3∙mini (high)*

130

OpenAI deep research**

26.6


GAlA

Level 1

Level 2

Level 3

Avg.

Previous SOTA

67.92

6744

42.31

63.64

Deep Research (pass^1)

74.29

69.06

476

67.36

Deep Research (cons@64)

78.66

73.21

5βQ3

72^7


* Model is not multi modal, evaluated on text-only subset.

**with browsing + python tools



准确率是此前OpenAI o1模型的近三倍


来源:https://openai.com/index/introducing-deep-research


技术协同: 多步推理,快速输出


GPT-4o对比


类别

DeepResearch

GPT-4o

功能目标

自动化多步骤研究任务 ,收集 、综合 、分析 、输出报告

语言生成,支持多种自然语言任务

任务执行方式

多模块协同,逐步执行复杂任务

单输入文本生成输出,处理单一任务

研究能力

处理复杂学术 、法律 、市场研究,支持多轮分析

生成创意内容,提供建议,适度推理分析

输入输出格式

支持图像 、PDF等多种格式输入输出

主要依赖文本输入输出

模块协作

多个模块协同工作(探索者 、整合者 、推理者等)

单一模型,无模块化协作


相比传统GPT-4o模型, Deep Research在多步推理、 数据验证、 处理


速度和信息追溯性方面表现出明显优势 。 这些提升有助于模型在复杂 任务中的表现更好, 特别是在需要高可靠性和高效执行场景中。




信息发现



推理

逻辑推理+自


输出

生成结构化 报告


应用场景1 学术研究,助力科研


文献综述加速


自动实验设计


DeepResearch能迅速梳理海量文献 提炼关键信息 ,显著提升文献综述效率。


基于已有实验数据自动生成最优实验设 计,预测可能的实验结果,并提出资源 最小化 、效能最大化的实验方案。


技术报告生成


"未来知识"生成器(预测性科研)


基于深度学习模型, 自动生成高质量技 术报告,确保研究成果的准确传达。


分析过去几十年各领域的论文发展轨迹 , 利用深度时间序列预测技术, 自动生成 某一领域在未来5-10年的潜在研究主题 、 理论突破 、以及可能的新技术趋势。


学术研究案例: 明确需求,报告生成


团队自测案例


通过百度网盘分享的文件: deep Research功能深度研究.docx

链接: https://pan.baidu.com/s/ 1pyaygXqFXvRe-In7gn5gOA?pwd=fn7s 提取码: fn7s



©


0


01 科研场景实测:


生物学研究生输入"CRISPR技术在

肿瘤免疫治疗中的最新进展"



02 获得:


近三年124


核心论文摘要


2.关键临床


试验数据


5.


3.汇总


技术路线对比图谱


4.待突破


向预测


符合APA


格式的参考文献库


应用场景2金融分析,市场预测


通过自动化数据收集 、整合 、推理与报告输出,提供全面的市场趋势预测和投资决策支持 。



场景应用    股票市场分析      风险管理与投资组合优化      宏观经济预测


数据分析

自动化处理财务报表,挖掘隐藏的投资机会 , 评估潜在风险, 优化资产配置策略 。

市场洞察      2

DeepResearch整合全球金融市

场动态, 实时追踪行业趋势, 为   1

投资者提供深度分析 。    1

智能预测

运用先进算法预测市场走势,辅助金融机 构和个人投资者做出更明智的选择 。

3      报告生成

一键生成专业级投资风险评估报告, 支持定制化需求,提升决策效率 。





金融分析案例:数据整合,供应链优化


>数据来源:全球12个交 易所的财报数据

A提取来自全球主要交易 所(如纽约证券交易所 、 道琼斯指数等) 的半导 体相关财报和数据



模型构建:


链接效率(如通信 、 ] 物流连接)


线条强度(如生产


物流效率(如运输


网络的化性)


预测和应对需求变 化的能力)


A情景模拟:

口建立基于5种不同情景(如需求波动 、突发 事件 、技术革新) 的供应链模拟模型 。

□使用Deep Research提供的可视化工具生 成可解释性的分析报告 , 展示各情景对供 应链压力及影响的具体路径 。


.

脆弱性评估


3. 情景模拟与建议



数据解析过程

□来自行业研报机构的178份半导 体供应链风险分析报告。

□解读各研报的核心观点 、关键指 标及预测方法。

□建立行业报告的质量评估体系, 识别高价值研报并进行分类。


供应链脆弱性评

使用层次分析法对各关键因素 进行权重评估 , 最终得出半导 体供应链的脆弱性等级 。

分析各研报中对供应链脆弱性 的描述 , 并结合数据来源和模 型构建结果 , 识别高风险区域 。


> 在供应链风险最高的环节加强协 同协作,并提供透明的沟通机制。

> 加强内部风险管理框架的设计, 建立应急响应和恢复计划。

>定期更新模型和数据来源 ,确保 预测准确性和前瞻性。


应用场景3消费决策,个性推荐



整合用户反馈


简化决策流程


整合用户反馈,提炼关 键意见,确保购买决策 基于真实用户体验,提 高决策质量。


通过突出产品性能差异, 简化消费者的决策流程, 减少选择困难,提高购 买效率。


对比产品参数


自动收集并对比同类产 品参数 ,突出性能差异 , 简化消费者的决策流程。


分析商品数据


场景应用


提供定制建议


通过分析海量商品数据 揭示市场趋势 ,帮助商 家精准定位消费者需求 ,

把握市场动态。


产品定位与定价策略


个性化营销策略


结合个人偏好与历史行 为,提供定制化的购买 建议,提升用户的购物 满意度。


消费决策场景案例: 需求识别,产品匹配


用户诉求: 拟购买滑雪板,对滑板的使用场景 、款式 、颜色 、价位 、适用场 景 、预计购买国家提出要求,指定DeepResearch给出建议


¥问题识别

面对海量市场数据, DeepResearch识 别用户的关键信息 并进行网络信息匹 配 。


巴解决方案

利用DeepResearch的智 能分析能力, 自动筛选出 符合用户每一部分诉求的 关键词,精准度和匹配度 大幅提升


成果亮点


通过自动化报告生成,显 著提升了搜索结果与用户 预期的匹配度,提高用户 的决策效率,辅助用户消 费决策 。


Deepresearch直接解决了用户的每一部分需求, 从板材 、规格到 颜色, 亮点以及可操作的滑行技巧 。同时还通过滑雪板的信息介绍, 分析了板材性能与用户可能使用场景和需求进行了匹配分析



GPT4o

Deepreaearch

Jones

TbeJones

Mid*

AMiatie

CAPnA

Mmfum Πα(5W)

Mountain

M<xnu*nT⅛∙π

Γ4∏g∙to

tħwugħ

Dtfendenof

l⅛h

is an a^∙ε∞ve

Rw⅛iin

HerreborB

¼momβ

twwthar

or*ct>cniZn

tg∏

(ImA)

camber-domifunt with *ht rocker

IXMrdlhot

that stιpto

AMkfouπ<ar

M∙ndsttw

Jtoparv

βt VPe (bRnort Vr PrafiDm 啲汨

ItabiStyofa

F^W<y⅜

CambcrgMQrtpQpaftjMgwhoMlQr

fτM∏dttnaπι

car*rς,jvt-added UpiRatthetipi

Withfhe

IrrPraMM float n POwd■( Yħ* true tiMn.

ptayħJnc9αf.

fr*ejtytβ bottfd.

blended rad⅛l a⅛⅛cut

HShybnd

CMnberroeMr

gM wM in “m. ** Mtfnev

prŋfite pro⅜mes

πu*s it state at speed but 旳"r

e»eelected9a

tree*. It⅝ a ρκ^ 90*8∏Λ*bere ðeei ∙

hcMfcr

CAPfTA1SMlMter-Myougeta


« wwɪ^oa 3~e->oft>⅝αι∙jw ><> ∙d,~¼ιo 59 “廿,J 5 , powder. Boards with a wider nose and rocker profiles can enħβnc4 floatation in deep snow.


• Temperaturei T⅞β region experiences cold temperatures, wħich keep tħe snow light and fluffy. Ensure ycχjr gβincluding outerwear and giovwst is BurtatMe for ky* teoperaturee.


• Local Brands; Iapanese brands Hk® Gontornstide and Moes Snσwstκk design boards SPeeiahCaAy for IOcaI conditions, Offeving performance aκt^angcκ in HokkaidcZs unique vκ>w.


When SeteCUng a snowboard, conβidef demoing different models if possible to find the best fit for your riding rty⅜ and the specific conditions you'll encounter.


-the black edition has big wħi<e GNU Ietterel and ∞me variants βκlude neongrapfucB.


Tabfe t:Alt nve recommenced snowboenis era


medrum-f/ex, M-moo∩taiπ oriented boards Chvf b∙tonce curving performance ^ndpcwdwc^p^bitify. Eacħ ∏MXteZ aVSitAbie through m<∕or retB^rB Ai Japan. Compa r iso∩ of Key Specifica t∙onκ


Sba p∙


Camb∙r Profile


(Rating) (Stance)


应用场景4 商业研究,决策支持


提供深入的市场趋势 、消费者行为洞察及竞争格局,为企业制定精准的商业策略提供支持。


数据来源: 社交媒体 、市场调查 、 行业报告 、消费者反馈等 。

信息发现


基于AI推理模型, 分析消费者行为 、市场 趋势 、竞争对手动态,预测未来商业机会

推理分析




市场趋 势预测



产品市 场定位



信息整合


输出报告



竞争对 手分析


将不同来源的结构化和非结构化数据进行 整合,形成全面的市场和消费者视角 。


生成定制化的商业报告,帮助管理层理解市场 格局 、识别潜在机会和风险,做出明智决策 。


商业研究场景案例: 市场洞察,优化策略



01


02


03


用户需求


收集信息


明确步骤及来源摘要


过去十年发达国家与发展中国家GDP


前十名的iOSAndroid的采用率, 学习外语的百分比及移动普及率, 求DeepResearch给出数据列表, 提出iOS翻译应用的市场建议


系统能够自动筛选出相关的文献资料 。



生成建议报告


05



GPT-4o


自动生成对比明晰的数据表, 提高工作效率 。


可视化的数据表格


04


Oep rweərŋh


Argentina


SouthAfrica


Insights:


• iOS and Android AdoPtiOn Rater Globa” AnoQR hoW* a <Jomiπβπt mβrta∙t share ςrf approXimatPty 70,93⅝, whie QS accounts foe about 28.32% as of 2024 In the United States. QS toəds wrtt a 5βΛl% market sham. Other developed COUnViee like Japan. Canada.

Austraha, and the United Kingdom also show a higher KMe<«nce for ∙OS O^√iceβ. In contreβt devekɔf)ing oouπtne* such as Irxlia and Brazi have a higher prevalence of ArxSroM d∙vcββ.


jy—D*■…      —*" "-t^

school (ft^.        peers)

Engliflhh strong Cttftural interest


Top 10 DeveIofMngZZmerging Economies (by GDP)-


(C∕>βK3FΓ 9W⅜tMVUWX>SX∕∙∏M^

Country

IOβ

AndroM

Interwat 5 Now

Mcb*∙

Martcet

MarkeI

Language

PeneU

Share

6har∙

(notable stats)

Ctiang (2OB∙

CNrul

•24%

(SM

V⅛ryHigh:

47W-*∙

A<Cft∙eGF7

iOS vs

75%

Ieft)

HUn^fwte 6

(ma

ΓBsiπctec⅜)

Android

millions


竞品分析:技术差异,性能对比



技术架构


C腾讯混元

依赖传统RL框框架



OpenAI



Deep Research 基于OpenAI o3模型 支持多步骤策略实时调整 与错误回溯


性能表现


未提及类似基准测试结 果,推测响应时间更长


在 “ 人类最后考试 ”中准 确率26 . 6 %( O1模型的 三倍) , 5-30分钟完成 传统数小时任务 。


应用广度


倾向于聚焦单一领域 (如金融)


覆盖学术 、金融 、消费 、 政策四大领域 , 案例已验 证跨领域适配性




用户体验


需分步提交指令


零门槛操作 , 用户仅需输 入提示 , 系统自主规划研 究流程


通过百度网盘分享的文件: 不同版本DeepResearch对比.zip

链接: https://pan. baidu. com/s/ 1vYEXJ_gpJMMYAXMXyYX3oQ?pwd=jjv9 提取码

--来自团队自测数据


Google

基于BERT等预训练模 型, 缺乏动态修正能力

仍依赖传统搜索卜人工分析

侧重通用搜索, 缺乏垂 直场景优化

需手动配置参数或分阶 丿

段操作

jjv9


AIGK+DeepResearch定制化AI 自动化转型


行业定制化AI赋能


端到端任务自动化


金融: 投资风险分析; 医疗: 药物 研发辅助; 法律: 合同智能审核; 制造业: 工艺优化等 。


行业知识库整合


汇聚行业专家经验 、案例数据; 构 建领域知识图谱, 为行业定制AI模 型奠定基础 。


“AI参谋赋能



定制化 AI 研究I 工具


7*24小时全天候服务,快速响应行业 专业问询, 自主开展深度行业研究 。




复杂任务


自动化



融合强化学习与推理技术, 实现多 步骤复杂任务的全流程自动化, 涵 盖财务 、营销 、设计等关键领域 。


人机共生新范式



I


化人机交互,AI系统自主完成规


划 、执行 、优化, 实时响应动态 需求变化,持续迭代 。


重塑企业运营效能


自动化处理海量重复性任务 , 聚焦高价值创造性工作, 大幅 降低运营成本,提升组织效率 。


AIGK ( Artificial Intelligence Generated Knowledge ),指的農通过人工智能技术自动生 成和扩展知识的过程.通俗来说,AlGK就像是一个智能的”知识创造者",它能务通过对海量 数据的学习和分析,自主发现新的知识和规律,而无需人类明确的指令


行业应用:AI定制, 自动化决策


实施场景


金融领域


金融机构在评估投资项目时 需 要快速识别潜在风险并做出决策 。


法律领域


•A I智能合同审核 系统 减少人工 审核的错误率 ,提升 司法透明度 。


制造业领域


•AI工艺优化平台, 帮助企业优化 生产流程, 降低成本并提升效率 。


数据来源:

□收集来自不同行业的数据源, 包括但不限于企业财务报表、 行业政策文件 、 专家报告等。

□将这些数据从多个平台获取, 并进行清洗和预处理。



传统模式 向数字化 转型



深入的数 据支持和 预测模型


A行业定制化AI赋能  > 行业知识库整合>   “AI参谋赋能


模型分析: 金融行业投资风险智能预测

A 金融公司: 基于实时数据, 智能预测投资项目 的风险等级(高、 中、低) 。

> 投资者: 通过AI分析后, 可获得投资决策的个 性化建议。


按照行业或主题对数据进 行分类存储, 例如:


企业财务报表 财务分析 、资 产负债表 、利润表等。


XZ


/金融机构决策支持:

通过AI模型预测投资项目 的风险等级, 帮助银行 做出更精准的投资决策。

/投资者个性化决策:

基于AI分析后, 可获得特定投资标的的风险评分, 进一步优化投资策略。


行业政策文件 政策法规 、行 业趋势 、监管规定等。


3


专家报告 宏观经济预测 、市 场前景分析 、行业趋势报告等。


口 快速响应能力:

在各种行业需求瞬息万变的情况下,

“AI参谋 ”能够提供即时的数据分 析和决策支持, 帮助客户迅速定位 问题并制定解决方案。

□ 自动化处理:

系统通过算法自动识别异常数据 、 预测市场趋势, 并生成快速反应的 建议。


技术创新:流程自动,突破效能


端到端任务自动化


人机共生新范式


重塑企业运营效能


任务分 析与状 态跟踪


自动识别任务的基本要求和限制 条件 。

使用强化学习算法跟踪任务的状 态变化(如预算使用 、产品数量 等) 。




、/


1. 自动化处理 与智能化决策


人机协同:优化人机交互界面, 减少人为干预,提升效率。

人机协作:支持多场景下的实 时响应,确保快速精准决策 。


数字化转 型与高效 管理


通过技术创新 、优化结构和提升效 率 ,实现企业的可持续发展 。



基于推理技术, 实时预测未来的 市场需求或用户行为 。

根据预测结果优化资源分配和决 策流程 ,确保高效性 。



2.深度行业研 究与数据驱动


基于深度学习的行业趋势预测 模型,支持企业动态适应市场 变化 。

数据驱动的人工智能模型 ,实 现专业预测和战略规划 。



通过数据反馈(如实际的使用情 况) 更新模型参数 。

进行持续优化,提升系统的适应 能力和效率 。



3.复杂任务的 全流程自动化


融合强化学习算法, 自动识别 高风险场景并提供相应建议 。

深入分析数据,优化决策流程, 确保全面覆盖核心业务环节。



自动化处 理与智能 化决策的 突破



自动化任务: 包括财务 、营销和设 计等领域的重复性操作 。

通过算法和机器学习技术, 自动识 别高风险场景并提供相应的建议或 优化方案 。

智能化决策: 融合强化学习与推理 技术 ,实时预测和优化决策过程 。

基于数据 ,动态跟踪任务的状态变 化(如预算使用 、产品数量等) 。


融合先进管理理念和技术手段,提 升企业核心竞争力 。高效操作减少 人为错误,提高响应速度 。

成本下降: 自动化减少人工干预中 的固定成本 。


认知协作 : 异构智能 , 集群协作


三阶认知生成体系


异构智能体集群

•数据勘探者(5个垂直领域AI

•逻辑架构师(3个推理引擎)

•批判审查团(2个逆向思维AI+人类专家接口)


行动建汉梯度


AIResearch生成报告样本:《 新能源汽车产业链投资机遇分析 》

封面

生成标识: ■ 本报告由XXX智能体集群经17轮辩论达成共识

时间戳:知识截止至2025-02-6 14:32:00

核心^i^ (Consensus Core)

I ið覆性机会

■固态电池电解质材料:

IA吩歧度12%] 202阵成本下降曲线斜率较预期提升23% (卫星图像分析显示中试产线良率超预期)

I风险预警

■稀土永磁供应链:

IAl置信度91%]缅甸政治动荡将导致2024Q4致铁硼价格波动率超历史极值68%


Stata                                                                                           建制

■犷即布局(胜率>?5

二找屯池厂商技术井的标的篇搶(附潜在目标清单)

■持续奥踪(变森別侑览驚)

4680电池0产良率VS特斯花股价弗件系数

■风除对冲(熏大帛防护)

建收建立修土期货空头头寸B每亿元首仓对应机83凤険抵消因了


多堆论证矩阵


技术売点标注

1.创新性辩论机制 智能体间设置!■认知温差J强制产生差异化视角

2.动态知识注入:每小时融合50+权威信源与2000+传感器数据流

3.可解释增强:点击任何结论可追溯完整逻辑链(示例见附录A)


维度

数据侦探AI发现

逻辑架构Al推演

反事实审直Al挑战

技术

拆解23万份专利发现:磷酸钺铁锂

材料突破将重构电池厂商

若宁德时代专利诉讼败

演进

研发集中度超预期

议价能力模型

诉将逆≡1

消费

充电桩评价数据掲示:J昉用户冬

热管理系统升级磊求催生

假设油价跌至60美元将

行为

季续航焦虑被低估58%

200β增置市场

延缓电动化进程


动态舞)识图18


pyt⅛∏                                                                               15

Graphi ι node       ∙∙ link ' ^-' ∙.∙ !■!-.'. V^∙'• to . ∙ . √∙ < ! ∙. ʌ 132^^ ι

nodeι ⅛∙Γif√ link ,, IO : ∙ H" ; t5 “"「∙ 」;;也「Tf T「) conflict l Λ ιλ …∙-国山……L ”… mβrk-red


引入优化agent 复杂任务 实现自动化



□ 目前AI主要是 ”助手 ”角 色, 需要用户提供明确指令, 无法自主完成复杂任务 。

□现有AI 工具 难以跨多个子任务自动执行, 仍需人工介入。


F创新点


. A I 自主任务规划与执行(AI Agent)

AI 能够自主分解任务、规划步骤,


并利用外部工具(如API 、 数据库 、 自动化流程)执行任务。


多 AI 代理协作

不同 AI 代理市场分析 Agent 、 法律 审核 Agent 、 财务预测 Agent) 可协 同完成复杂任务 ,形成智能工作流。


• 任务反馈 & 自主学习

AI 在执行任务后自动优化策略, 使任务执行效果不断增强。


》应用示例





>智能法律顾问 A1:自动读取合同 , 分析潜在法律风险 , 生成修改建议 , 并与企业法务系统对接完 成合规审查。

>企业 AI CEO:结合市场数据、 财务数据 , 自动生成年度战略规划 , 并动态调整业务目标。

>智能招聘 A1:筛选简历、 面试候选人(语音/视频 AI 面试)、 自动发送 offer , 并完成 HR 系统录入。


增强知识图谱 : 多维解释 , 溯源路径

Q传统方法的局限


□幻觉率过高, 高价值信息过少, 致使企业用户难以信任 AI生成的行业研究和决策结果。


创新点


知识图谱增强

LLM(LLM+KG)


可追溯的 A I 研究报告


结合AI 生成知识(AIGK)与行业知识图谱, 使 AI具备强逻辑推理能力。


所有 AI 生成的内容提供可溯 源数据 ,确保数据可信度。


»应用示例



可解释的 A I 运行决策

AI 在做出决策时 ,会提供基于知识图 谱的逻辑推理路径 ,增强可解释性。


A金融风险评估与决策支持:

通过结合金融知识图谱和AIGK技术 ,AI能够提供透明的决策过程和可解释的投资建议 , 增强金融决策的信任度。

> 医疗诊断与个性化治疗:

利用医学知识图谱和AIGK推理 ,AI不仅给出治疗方案 , 还能解释每个建议背后的医学依据 ,提升医生和患者的信任。