您的当前位置:首页动态内存分配导致影响Javascript性能的问题

动态内存分配导致影响Javascript性能的问题

2020-11-27 来源:乌哈旅游

内存分配对性能的影响是很大的,分配内存本身需要时间,垃圾回收器回收内存也需要时间,所以应该尽量避免在堆里分配内存。不过直到最近优化HoLa cantk时,我才深刻的体会到内存分配对性能的影响,其中有一个关于arguments的问题挺有意思,写在这里和大家分享一下。

我要做的事情是用webgl实现canvas的2d API(这个话题本身也是挺有意思的,有空我们再讨论),drawImage是一个重要的函数,游戏会频繁的调用它,所以它的性能至关重要。drawImage的参数个数是可变的,它有三种形式:

  • drawImage(image, x, y)
  • drawImage(image, x, y, width, height)
  • drawImage(image, sx, sy, sw, sh, dx, dy, dw, dh)
  • 第一个版本大概是这样实现的:

    function Context() {
    }
    Context.prototype.drawImage3 = function(image, x, y) {
     this.drawImage9(image, 0, 0, image.width, image.height, x, y, image.width, image.height);
    }
    Context.prototype.drawImage5 = function(image, dx, dy, dw, dh) {
     this.drawImage9(image, 0, 0, image.width, image.height, dx, dy, dw, dh);
    }
    Context.prototype.drawImage9 = function(image, sx, sy, sw, sh, dx, dy, dw, dh) {
     //DO IT
    }
    Context.prototype.drawImage = function(image, a, b, c, d, e, f, g, h) {
     var n = arguments.length;
     if(n === 3) {
     this.drawImage3(image, a, b);
     }else if(n === 5) {
     this.drawImage5(image, a, b, c, d);
     }else if(n === 9) {
     this.drawImage9(image, a, b, c, d, e, f, g, h);
     }
    }

    为了方便说明问题,我把测试程序独立出来:

    var image = {width:100, height:200};
    var ctx = new Context();
    function test() {
     var a = Math.random() * 100;
     var b = Math.random() * 100;
     var c = Math.random() * 100;
     var d = Math.random() * 100;
     var e = Math.random() * 100;
     var f = Math.random() * 100;
     var g = Math.random() * 100;
     var h = Math.random() * 100;
     for(var i = 0; i < 1000; i++) {
     ctx.drawImage(image, a, b);
     ctx.drawImage(image, a, b, c, d);
     ctx.drawImage(image, a, b, c, d, e, f, g, h);
     }
    }
    window.onload = function() {
     function loop() {
     test();
     requestAnimationFrame(loop);
     }
     requestAnimationFrame(loop);
    }

    用chrome的Profile查看CPU的使用情况时,我发现垃圾回收的时间比例很大,一般在4%以上。当时并没有怀疑到drawImage这个函数,理由很简单:

    这个函数很简单,它只是一个简单的分发函数,而drawImage9的实现相对来说要复杂得多。

    这里看不出有动态内存分配,也没有违背arguments的使用规则,只是使用了它的length属性。

    加trace_opt和trace_deopt参数运行时,drawImage被优化了,而且没有被反优化出来。

    Chrome的内存Profile只能看到没有被释放的对象,用它查看内存泄露比较容易。这里的问题并不是泄露,而是分配了然后又释放了,V8采用的分代垃圾回收器,这种短时存在的对象是由年轻代回收器管理器负责的,而年轻代回收器使用的半空间(semi-space)算法,这种大量短时间生存的对象,很快会耗尽其中一半空间,这时回收器需要把存活的对象拷贝到另外一半空间中,这就会耗费大量时间,而垃圾回收时会暂停JS代码执行,如果能避免动态内存分配,减少垃圾回收器的工作时间,就能提高程序的性能。

    没法在Chrome里查看动态分配内存的地方(呵呵,后面证实是我的无知),只好去硬着头皮看V8 JS引擎的代码,看看能不能找到频繁分配内存的地方,后来找到了V8统计内存分配的代码:

    void Heap::OnAllocationEvent(HeapObject* object, int size_in_bytes) {
     HeapProfiler* profiler = isolate_->heap_profiler();
     if (profiler->is_tracking_allocations()) {
     profiler->AllocationEvent(object->address(), size_in_bytes);
     }
     if (FLAG_verify_predictable) {
     ++allocations_count_;
     // Advance synthetic time by making a time request.
     MonotonicallyIncreasingTimeInMs();
     UpdateAllocationsHash(object);
     UpdateAllocationsHash(size_in_bytes);
     if (allocations_count_ % FLAG_dump_allocations_digest_at_alloc == 0) {
     PrintAlloctionsHash();
     }
     }
     if (FLAG_trace_allocation_stack_interval > 0) {
     if (!FLAG_verify_predictable) ++allocations_count_;
     if (allocations_count_ % FLAG_trace_allocation_stack_interval == 0) {
     isolate()->PrintStack(stdout, Isolate::kPrintStackConcise);
     }
     }
    }

    HeapProfiler已经有了内存分配的统计代码,Chrome里应该有对应的接口啊。再去看Chrome的Profile相关界面,最后发现需要在设置里勾选Record heap allocation stack traces,然后使用Record heap allocations功能,查看结果时选择Allocations,可以看到每个函数分配内存的次数。有时一个问题折腾你好久,解决之前百思不得其解,觉得难得不得了,而解决之后忍不住要苦笑,原来只是一层窗户纸!

    虽然还是不知道导致动态内存分配的原因(谁知道请告诉我),至少可以想法规避它:

    Context.prototype.drawImage = function() {
     var n = arguments.length;
     if(n === 3) {
     this.drawImage3.apply(this, arguments);
     }else if(n === 5) {
     this.drawImage5.apply(this, arguments);
     }else if(n === 9) {
     this.drawImage9.apply(this, arguments);
     }
    }

    总结

    显示全文