opengl es
Shader – asm
asm文档在MSDN上的地址:
http://msdn.microsoft.com/en-us/library/bb219840(v=vs.85).aspx 微软垄断是真的,但是文档好也是真的。
1、asm离不开GPU内部的architecture,看一下vs 1.1的,在汇编语言中,comment是用分号而不是C中的双斜杠。
所有数据在vs中都是128位的。
相对应的寄存器如下:
Input V0 ~ V15 共16个 Output O* 9个(11个 Radeon) Constant C0 ~ C95 96个(ATI的有196个的) Temporary r0 ~ r11 12个 Addr … … … … 阅读更多
congratulation, my vs casm compiler is run ok !
花了一周的时间才把汇编器写好和调好,终于可以开始写代码了。祝贺一下。每天下班了才做这个,郁闷呀。肚子饿饿呀,出去吃饭,回去继续写我的论文。晕,有多少事情要干!
目前支持61条指令。有时间移植到windows下,好做我的系统级的混合仿真呀。
vertex shader asm compiler
现在正在写linux下的指令编译器,后面会移植到windows上。下面记录一些需要的移植资料,方便后面查找。
STL中map用法详解
分类:std map
部分文章来自于网络,如有侵权请联系站长,以便及时卸下来
//
google_ad_client = “pub-8491305208851395″;google_ad_slot = “0333958542″;google_ad_width = 468;google_ad_height = 60;
//
std map是STL的一个关联容器,它提供一对一(其中第一个可 … … … … 阅读更多
radix-4 sd multiplier
好久没有更新了,今天研究了一下radix-4 sd multiplier。共享一个课程,讲的不错,希望对大家有帮助。我的sfu架构设计明天应该就结束了,可以开始systemc coding了。
http://ece.gmu.edu/~dhwang/ece645/spring2008/
AT-EGPU中的VERTEX SHADER的指令
AT-EGPU中的VERTEX SHADER的指令
目前设计的VERTEX SHADER,因为只支持gles1.1,所以数据结构都选用顶点格式。现在设计指令长度64bit。 分三类SIMD指令 1) mov,add,sub,max,min,sge,slt,seq,lsl,asr.zero,xor,or,and,nop,end 2) mul,mad,dp2,dp3,dp4,trfm 3) rcp,rsq,pow2,log2 指令应该还会添加别的,以快速实现clipping操作。 指令结构如下: opcode|adr mode|write mask| swizzle|neg|dst | … … … … 阅读更多
第3次的vincent研究完成,milestone
第3次的vincent研究完成,milestone.
记录一下,不容易,终于分析清楚了,应该可以开始测试了。历时3个月,每周一致周四晚上在实验室研究,花费了不少时间。辛苦终于要开始收获了,下面应该进度会更快的。
三星的3d引擎架构
vincent研究完成,现在开始测试他的引擎,添加各种case。下面是三星的一款3d引擎架构的features。
这是他的feature 42.1.1 FEATURES • 4M triangles/s @133MHz (Transform Only) • 75.8M pixels/s fill-rates @133MHz (shaded pixels) • Programmable Shader Model 3.0 support • 128-bit (32-bit x 4) Floating-point Vertex Shader – Geometry-texture cache supp … … … … 阅读更多
JIT,just-in-time compilation
JIT(just-in-time compilation,即时编译)指计算机领域里,即时编译也被称为动态翻译(dynamic translation),是一种通过在运行时将字节码翻译为机器码,从而改善字节码编译语言性能的技术。即时编译前期的两个运行时理论是字节码编译和动态编译。
在编译为字节码的系统如 Limb 编程语言,Smalltalk,UCSD P-System, Perl,GNU CLISP,和 Java 的早期版本中, 源代码被翻译为一种中间表示即字节码。 字节码不是任何特定计算机的机器码, 它可以在多种计算机体系中移植。 字节码被解释着运行在虚拟机里。
动态编译环境是一种在执行时使 … … … … 阅读更多
OpenGL入门学习——第十四课,OpenGL版本和OpenGL扩展
点击下载附件
现在即将放出的是第十四课的内容。 首先还是以前课程的连接: 第一课,编写第一个OpenGL程序 第二课,绘制几何图形 第三课,绘制几何图形的一些细节问题 第四课,颜色的选择 第五课,三维的空间变换 第六课,动画的制作 第七课,使用光照来表现立体感 第八课,使用显示列表 第九课,使用混合来实现半透明效果 第十课,BMP文件与像素操作 第十一课,纹理的使用入门 第十二课,OpenGL片断测试 第十三课,OpenGL是一个状态机 第十四课,OpenGL版本和OpenGL扩展 –→ 本次课程的内容 这次要讲的是OpenGL版本和OpenGL扩展。呵呵,你的系统支持什么版本的 … … … … 阅读更多
vincent代码阅读
基本看了一遍vincent的代码,发现他是针对arm专门做优化的opengl-es的实现。其中使用了runtime code generation 编译方法生成优化的ARM CODE,做提速。看来我得找找以前的版本,看能否跳过这块。
