Ang Deepseek-R1 na pinagsasama ang AI at Edge Computing para sa Industrial IoT

Panimula

Ang mga maliit na laki ng distilled na mga modelo ng DeepSeek-R1 ay maayos na gamit gamit ang data na naisip ng chain-of-thought na nabuo ng Deepseek-R1, na minarkahan ng...mga tag, na nagmana ng mga kakayahan sa pangangatuwiran ng R1. Ang mga pinong naka-tono na mga datasets ay malinaw na kasama ang mga proseso ng pangangatuwiran tulad ng pagkabulok ng problema at mga intermediate na pagbabawas. Ang pag -aaral ng pagpapatibay ay nakahanay sa mga pattern ng pag -uugali ng distilled model na may mga hakbang na pang -uudyok na nabuo ng R1. Ang mekanismo ng distillation na ito ay nagbibigay-daan sa mga maliliit na modelo upang mapanatili ang kahusayan sa computational habang nakakakuha ng kumplikadong mga kakayahan sa pangangatuwiran na malapit sa mga mas malalaking modelo, na kung saan ay may makabuluhang halaga ng aplikasyon sa mga senaryo na napilitan ng mapagkukunan. Halimbawa, ang bersyon ng 14B ay nakamit ang 92% ng pagkumpleto ng code ng orihinal na modelo ng Deepseek-R1. Ipinakikilala ng artikulong ito ang modelo ng DEEPSEEK-R1 DISTILLED at ang mga pangunahing aplikasyon nito sa pang-industriya na pag-compute ng gilid, na naitala sa sumusunod na apat na direksyon, kasama ang mga tiyak na kaso ng pagpapatupad:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Mahuhulaan ang pagpapanatili ng kagamitan

Pagpapatupad ng teknikal

Fusion ng sensor:

Isama ang panginginig ng boses, temperatura, at kasalukuyang data mula sa mga PLC sa pamamagitan ng ModBus protocol (sampling rate 1 kHz).

Tampok na pagkuha:

Patakbuhin ang salpok sa gilid sa Jetson Orin NX upang kunin ang mga tampok na 128-dimensional na mga serye ng serye.

Pag -iingat ng Model:

I-deploy ang modelo ng DeepSeek-R1-Distill-14B, pag-input ng tampok na mga vectors upang makabuo ng mga halaga ng posibilidad ng pagkakamali.

Dinamikong Pagsasaayos:

Mga order sa pagpapanatili ng trigger kapag kumpiyansa> 85%, at simulan ang isang pangalawang proseso ng pag -verify kapag <60%.

May kaugnayan na kaso

Ang Schneider Electric ay nagpadala ng solusyon na ito sa makinarya ng pagmimina, binabawasan ang maling positibong rate ng 63% at mga gastos sa pagpapanatili ng 41%.

1

Pagpapatakbo ng Deepseek R1 Distilled Model sa Inhand Ai Edge Computers

Pinahusay na visual inspeksyon

Arkitektura ng Output

Karaniwang Pipeline ng Pag -deploy:

camera = gige_vision_camera (500fps) # gigabit pang -industriya camera
frame = camera.capture () # capture image
preprocessed = opencv.denoise (frame) # denoising preprocessing
defect_type = deepseek_r1_7b.infer (preprocessed) # defect classification
Kung defect_type! = 'normal':
Plc.trigger_reject () # mekanismo ng pag -uuri ng pag -trigger

Mga sukatan ng pagganap

Pagproseso ng Pagproseso:

82 MS (Jetson AGX Orin)

Katumpakan:

Umabot sa 98.7%ang iniksyon na hinubog na depekto ng depekto sa 98.7%.

2

Mga Implikasyon ng Deepseek R1: Ang mga nagwagi at natalo sa chain ng halaga ng AI

Pag -optimize ng daloy ng proseso

Mga pangunahing teknolohiya

Pakikipag -ugnay sa Likas na Wika:

Inilarawan ng mga operator ang mga anomalya ng kagamitan sa pamamagitan ng boses (halimbawa, "extruder pressure fluctuation ± 0.3 MPa").

Multimodal na pangangatuwiran:

Ang modelo ay bumubuo ng mga mungkahi sa pag -optimize batay sa kagamitan sa kasaysayan ng kagamitan (halimbawa, pag -aayos ng bilis ng tornilyo ng 2.5%).

Digital na pag -verify ng kambal:

Ang pagpapatunay ng simulation ng parameter sa platform ng Edgex Foundry.

Epekto ng pagpapatupad

Ang halaman ng kemikal ng BASF ay nagpatibay sa pamamaraan na ito, na nakamit ang isang 17% na pagbawas sa pagkonsumo ng enerhiya at isang 9% na pagtaas sa rate ng kalidad ng produkto.

3

Edge AI at ang Hinaharap ng Negosyo: Openai O1 kumpara sa Deepseek R1 para sa Pangangalaga sa Kalusugan, Sasakyan, at IIOT

Instant na pagkuha ng base ng kaalaman

Disenyo ng Arkitektura

Lokal na database ng vector:

Gumamit ng ChromadB upang mag -imbak ng mga manual ng kagamitan at mga pagtutukoy sa proseso (Embedding Dimension 768).

Hybrid Retrieval:

Pagsamahin ang BM25 algorithm + pagkakapareho ng kosine para sa query.

Henerasyon ng resulta:

Ang modelo ng R1-7B ay nagbubuod at pinino ang mga resulta ng pagkuha.

Karaniwang kaso

Ang mga inhinyero ng Siemens ay nalutas ang mga pagkabigo sa inverter sa pamamagitan ng mga natural na query sa wika, binabawasan ang average na oras ng pagproseso ng 58%.

Mga hamon at solusyon sa pag -deploy

Mga limitasyon sa memorya:

Ginamit ang teknolohiya ng dami ng cache ng KV, binabawasan ang paggamit ng memorya ng 14B modelo mula sa 32GB hanggang 9GB.

Tinitiyak ang pagganap ng real-time:

Patatag na solong pagkilala sa latency sa ± 15 ms sa pamamagitan ng pag -optimize ng graph ng CUDA.

Model Drift:

Lingguhang pag -update ng pagdaragdag (pagpapadala lamang ng 2% ng mga parameter).

Matinding kapaligiran:

Dinisenyo para sa malawak na saklaw ng temperatura ng -40 ° C hanggang 85 ° C na may antas ng proteksyon ng IP67.

5
微信图片 _20240614024031.jpg1

Konklusyon

Ang mga kasalukuyang gastos sa paglawak ay nabawasan ngayon sa $ 599/node (Jetson Orin NX), na may mga nasusukat na aplikasyon na bumubuo sa mga sektor tulad ng 3C manufacturing, automotive assembly, at enerhiya chemistry. Ang patuloy na pag -optimize ng arkitektura ng MOE at teknolohiya ng dami ay inaasahan na paganahin ang modelo ng 70B na tumakbo sa mga aparato sa gilid sa pagtatapos ng 2025.

Maghanap ng solusyon ng ELV cable

Mga control cable

Para sa BMS, Bus, Industrial, Instrumentation Cable.

Nakabalangkas na sistema ng cabling

Network at data, fiber-optic cable, patch cord, module, faceplate

2024 Repasuhin at Mga Kaganapan sa Pagsusuri

Abril.16th-18th, 2024 Middle-East-Energy sa Dubai

Abril.16th-18th, 2024 Securika sa Moscow

Mayo.9th, 2024 Mga Bagong Produkto at Teknolohiya ng Paglulunsad ng Kaganapan sa Shanghai

Oktubre.22nd-25th, 2024 Security China sa Beijing

Nob.19-20, 2024 Konektadong mundo KSA


Oras ng Mag-post: Pebrero-07-2025