CANN社区任务-prims.ndtri API开发 7月社区任务-prims.ndtri API开发任务书【免费下载链接】cann-ops-competitions本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。项目地址: https://gitcode.com/cann/cann-ops-competitions基础信息技术标签高阶API开发适配硬件Ascend 950PR/Ascend 950DT开源仓地址https://gitcode.com/ascend/asc-devkitCANN 版本本次社区任务指定CANN版本开发语言Ascend C任务概述基于 PyTorch IR 的prims.ndtri接口在昇腾 NPU 上使用 Ascend C 编程语言实现对应的高阶API。该API用于计算标准正态分布的逆累积分布函数分位数函数输入概率值p输出对应的z值使得P(Z≤z)p完成API设计、开发、测试全流程工作测试通过后将代码提交至asc-devkit开源仓。核心开发要求及验收标准功能实现要求与 PyTorch IRprims.ndtri接口核心功能完全对齐支持原API对应的所有数据类型float32、数据格式。支持API泛化功能满足各类合法输入场景的计算需求验收阶段将采用泛化数据进行验收。正确处理边界情况输入值在[0,1]范围外、极端概率值处理、NaN/Inf特殊值处理。测试标准需自行设计全场景自验证用例验收阶段将采用泛化数据进行功能、精度、性能全维度验证。自验证报告完整、可复现所有测试用例执行通过。性能要求至少实现Cube/Vector/MTE其中一个Bound任一流水占比超80%。特殊场景无法达标的如小shape场景等需提供性能仿真图和分析结论佐证。精度要求构造API测试用例计算精度需满足AscendOpTest工具默认阈值。文档规范要求API设计文档可根据模板填写内容完整、格式规范且必须通过评审。设计文档需在asc-devkit仓提交文档评审issue2工作日内反馈评审结果如方案有更新评审时间同步刷新。自验证报告除基础场景外还应覆盖边界值场景具体可参考算子自验证报告需包含测试用例执行日志/截图、整体测试通过截图、性能数据截图可指导复现测试结果。README 文档内容完整、规范可参考代码仓API的接口说明文档。验收交付件asc-devkit开源仓 fork 的个人代码仓链接需包含API代码、API README 文档、UT代码、多场景的功能测试代码。交付件可按照如下目录提交├── docs # API接口说明文档 ├── impl # API接口实现源代码 ├── include # API接口声明源代码 └── tests # API的测试代码包括单元测试和功能测试用例API自验证报告。评审通过的API设计文档。PR 申请合入测试通过后在asc-devkit开源仓提交 PR 申请申请将开发完成的API合入 https://gitcode.com/cann/asc-devkit/tree/master/experimental/ 。PyTorch IR参考信息PyTorch官方文档: https://docs.pytorch.org/docs/stable/special.html#torch.special.ndtri参考资料文档类Ascend C高阶API贡献指南Ascend C快速入门Ascend C接口列表。课程类Ascend C在线课程。参考样例asc-devkit仓库中的现有高阶API实现。环境获取开源仓提供100小时免费时长请不使用时及时关闭用时耗尽前请务必保存相关资料建议及时提交备份。使用 hidevlab notebook 算力。如需额外环境资源请联系昇腾小助手。特别注意事项开发过程需严格遵循社区编码规范。所有交付件需提前完成自验证确认符合验收标准后再提交验收申请。开发前请务必阅读【社区任务】流程及注意事项。【免费下载链接】cann-ops-competitions本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。项目地址: https://gitcode.com/cann/cann-ops-competitions创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

最新新闻

大模型真实工作流测评:ChatGPT、Qwen、DeepSeek谁更适合办公提效?

大模型真实工作流测评:ChatGPT、Qwen、DeepSeek谁更适合办公提效?

1. 这不是一场“谁更聪明”的表演赛,而是一次面向真实工作流的压力测试你有没有在深夜改完第三版方案后,对着空白的PPT标题栏发呆?有没有在客户临时加需求的会议前五分钟,才想起要整理一份带数据支撑的竞品分析?有没有…

2026/7/5 21:49:13
GTSR:半透明物体毫米级精度三维重建技术解析

GTSR:半透明物体毫米级精度三维重建技术解析

1. 项目概述在计算机视觉和图形学领域,半透明物体的三维重建一直是个棘手的问题。想象一下,当你试图用普通相机拍摄一块磨砂玻璃或玉石摆件时,会发现物体内部的光线散射让边缘变得模糊不清——这正是传统三维重建方法难以准确捕捉半透明物体的…

2026/7/5 21:49:13
蒙特卡洛(MC)与动态规划(DP)对比:5 个维度解析无模型与有模型差异

蒙特卡洛(MC)与动态规划(DP)对比:5 个维度解析无模型与有模型差异

蒙特卡洛与动态规划深度对比:5个维度解析无模型与有模型强化学习差异1. 核心概念与基础原理在强化学习领域,蒙特卡洛(Monte Carlo, MC)和动态规划(Dynamic Programming, DP)代表了两种截然不同的方法论体系…

2026/7/5 21:49:13
YOLOv8目标检测优化:Mamba线性注意力技术解析

YOLOv8目标检测优化:Mamba线性注意力技术解析

1. 项目概述:当Mamba遇上线性注意力在目标检测领域,YOLOv8作为当前最先进的实时检测框架之一,其性能优化一直是研究热点。近期工作中,我们发现传统注意力机制在处理高分辨率图像时面临两大痛点:一是计算复杂度随序列长…

2026/7/5 21:49:13
脉冲神经网络SpikeTrack:低功耗视觉追踪技术解析

脉冲神经网络SpikeTrack:低功耗视觉追踪技术解析

1. SpikeTrack:脉冲驱动视觉追踪的突破性框架在计算机视觉领域,目标追踪一直是个计算密集型任务。传统基于RGB帧的追踪算法需要处理大量冗余像素数据,导致能耗居高不下。而SpikeTrack的出现,通过脉冲神经网络(SNN&…

2026/7/5 21:49:13
L3ROcc开源框架:智能手机实现高质量3D感知数据采集

L3ROcc开源框架:智能手机实现高质量3D感知数据采集

1. 项目概述L3ROcc是一个革命性的开源框架,它彻底改变了传统3D感知数据的采集方式。作为一名长期从事计算机视觉和机器人导航研究的工程师,我亲身体验过传统数据采集方法的种种痛点:昂贵的硬件设备、复杂的多传感器标定流程、漫长的数据处理周…

2026/7/5 21:44:13

月新闻