CANN/Ascend C对齐数据搬运接口 asc_loadalign_unpack4【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明对齐数据搬运接口从UB连续对齐搬入目的操作数实现UNPACK4搬入模式解压缩模式按无符号整型u8加载VL/4长度数据unpack到VL长度u32类型中间位置补0。支持三种偏移方式偏移固定传入0由用户自行更新源操作数的地址。通过int32_t传入偏移用户可以选择更新偏移或者更新源操作数的地址。通过iter_reg地址寄存器传入偏移用户可以选择更新偏移或者更新源操作数的地址。函数原型偏移固定传入0由用户自行更新源操作数的地址__simd_callee__ inline void asc_loadalign_unpack4(vector_int8_t dst, __ubuf__ int8_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_uint8_t dst, __ubuf__ uint8_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp4x2_e2m1_t dst, __ubuf__ fp4x2_e2m1_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp4x2_e1m2_t dst, __ubuf__ fp4x2_e1m2_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e8m0_t dst, __ubuf__ fp8_e8m0_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e5m2_t dst, __ubuf__ fp8_e5m2_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e4m3fn_t dst, __ubuf__ fp8_e4m3fn_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_hifloat8_t dst, __ubuf__ hifloat8_t* src) __simd_callee__ inline void asc_loadalign_unpack4(vector_int4x2_t dst, __ubuf__ int4b_t* src)通过int32_t传入偏移__simd_callee__ inline void asc_loadalign_unpack4(vector_int8_t dst, __ubuf__ int8_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_uint8_t dst, __ubuf__ uint8_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp4x2_e2m1_t dst, __ubuf__ fp4x2_e2m1_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp4x2_e1m2_t dst, __ubuf__ fp4x2_e1m2_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e8m0_t dst, __ubuf__ fp8_e8m0_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e5m2_t dst, __ubuf__ fp8_e5m2_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e4m3fn_t dst, __ubuf__ fp8_e4m3fn_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_hifloat8_t dst, __ubuf__ hifloat8_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_int4x2_t dst, __ubuf__ int4b_t* src, int32_t offset)通过iter_reg地址寄存器传入偏移__simd_callee__ inline void asc_loadalign_unpack4(vector_fp4x2_e1m2_t dst, __ubuf__ fp4x2_e1m2_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp4x2_e2m1_t dst, __ubuf__ fp4x2_e2m1_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_int4x2_t dst, __ubuf__ int4b_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_uint8_t dst, __ubuf__ uint8_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_int8_t dst, __ubuf__ int8_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e4m3fn_t dst, __ubuf__ fp8_e4m3fn_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_hifloat8_t dst, __ubuf__ hifloat8_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e5m2_t dst, __ubuf__ fp8_e5m2_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_unpack4(vector_fp8_e8m0_t dst, __ubuf__ fp8_e8m0_t* src, iter_reg offset)参数说明参数名输入/输出描述dst输出目的操作数矢量数据寄存器。src输入源操作数矢量的起始地址。offset输入偏移量。矢量数据寄存器的详细说明请参见reg数据类型定义.md。返回值说明无流水类型PIPE_V约束说明无调用示例vector_int8_t dst; __ubuf__ int8_t* src; asc_loadalign_unpack4(dst, src);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

最新新闻

反直觉的追及问题

反直觉的追及问题

问题背景快到年末了,朋友公司有个很奇葩的要求,需要每年完成跑步任务,完不成的的会影响到KPI。为了完成这N公里的跑步,很多人选择了步数神器——摇手机。 摇了手机之后发现,有一条要求比较麻烦,至少完成一次…

2026/7/4 9:10:58
AI驱动测试革命:DeepSeek与Playwright实现自动化脚本智能生成

AI驱动测试革命:DeepSeek与Playwright实现自动化脚本智能生成

1. 项目概述:当AI大模型遇上现代浏览器自动化最近在搞自动化测试的团队,估计没少为写测试脚本头疼。尤其是UI自动化,一个页面改个按钮位置,可能就得花半天时间去调定位器,更别提那些复杂的交互流程和异常场景覆盖了。我…

2026/7/4 9:10:58
AI驱动自动化测试:DeepSeek与Playwright结合提升测试覆盖率实践

AI驱动自动化测试:DeepSeek与Playwright结合提升测试覆盖率实践

1. 项目概述:当AI代码助手遇上现代浏览器自动化最近在搞自动化测试的团队,估计没少为写脚本和维护脚本头疼。特别是UI自动化,页面元素一变,脚本就得跟着改,维护成本高不说,测试覆盖率也常常是个老大难问题。…

2026/7/4 9:10:58
HsMod:炉石传说终极增强插件,55项功能重塑你的卡牌游戏体验

HsMod:炉石传说终极增强插件,55项功能重塑你的卡牌游戏体验

HsMod:炉石传说终极增强插件,55项功能重塑你的卡牌游戏体验 【免费下载链接】HsMod Hearthstone Modification Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod 你是否厌倦了炉石传说中繁琐的日常任务?是否…

2026/7/4 9:10:58
Agent Skills技能中间件:在技能执行链中插入处理逻辑

Agent Skills技能中间件:在技能执行链中插入处理逻辑

Agent Skills技能中间件:在技能执行链中插入处理逻辑 【免费下载链接】agentskills Specification and documentation for Agent Skills 项目地址: https://gitcode.com/GitHub_Trending/ag/agentskills Agent Skills是GitHub推荐项目精选(ag/age…

2026/7/4 9:10:58
pg_tileserv 项目常见问题解决方案

pg_tileserv 项目常见问题解决方案

pg_tileserv 项目常见问题解决方案 【免费下载链接】pg_tileserv A very thin PostGIS-only tile server in Go. Takes in HTTP tile requests, executes SQL, returns MVT tiles. 项目地址: https://gitcode.com/gh_mirrors/pg/pg_tileserv 基础介绍 pg_tileserv 是一…

2026/7/4 9:05:58

周新闻

月新闻