Subversion Repositories Kolibri OS

Rev

Rev 3263 | Rev 3277 | Go to most recent revision | Blame | Compare with Previous | Last modification | View Log | Download | RSS feed

  1.  
  2. #define iowrite32(v, addr)      writel((v), (addr))
  3.  
  4. #include "drmP.h"
  5. #include "drm.h"
  6. #include "i915_drm.h"
  7. #include "i915_drv.h"
  8. #include "intel_drv.h"
  9.  
  10. #include <linux/kernel.h>
  11. #include <linux/module.h>
  12. #include <linux/mod_devicetable.h>
  13. #include <errno-base.h>
  14. #include <linux/pci.h>
  15.  
  16. #include <syscall.h>
  17.  
  18. #include "hmm.h"
  19. #include "bitmap.h"
  20.  
  21. extern struct drm_device *main_device;
  22.  
  23.  
  24. typedef struct
  25. {
  26.     kobj_t     header;
  27.  
  28.     uint32_t  *data;
  29.     uint32_t   hot_x;
  30.     uint32_t   hot_y;
  31.  
  32.     struct list_head   list;
  33.     struct drm_i915_gem_object  *cobj;
  34. }cursor_t;
  35.  
  36. #define CURSOR_WIDTH 64
  37. #define CURSOR_HEIGHT 64
  38.  
  39.  
  40. struct tag_display
  41. {
  42.     int  x;
  43.     int  y;
  44.     int  width;
  45.     int  height;
  46.     int  bpp;
  47.     int  vrefresh;
  48.     int  pitch;
  49.     int  lfb;
  50.  
  51.     int  supported_modes;
  52.     struct drm_device    *ddev;
  53.     struct drm_connector *connector;
  54.     struct drm_crtc      *crtc;
  55.  
  56.     struct list_head   cursors;
  57.  
  58.     cursor_t   *cursor;
  59.     int       (*init_cursor)(cursor_t*);
  60.     cursor_t* (__stdcall *select_cursor)(cursor_t*);
  61.     void      (*show_cursor)(int show);
  62.     void      (__stdcall *move_cursor)(cursor_t *cursor, int x, int y);
  63.     void      (__stdcall *restore_cursor)(int x, int y);
  64.     void      (*disable_mouse)(void);
  65.     u32  mask_seqno;
  66.     u32  check_mouse;
  67.     u32  check_m_pixel;
  68.  
  69. };
  70.  
  71.  
  72. static display_t *os_display;
  73.  
  74. u32_t cmd_buffer;
  75. u32_t cmd_offset;
  76.  
  77. void init_render();
  78. int  sna_init();
  79.  
  80. int init_cursor(cursor_t *cursor);
  81. static cursor_t*  __stdcall select_cursor_kms(cursor_t *cursor);
  82. static void       __stdcall move_cursor_kms(cursor_t *cursor, int x, int y);
  83.  
  84. void __stdcall restore_cursor(int x, int y)
  85. {};
  86.  
  87. void disable_mouse(void)
  88. {};
  89.  
  90. static char *manufacturer_name(unsigned char *x)
  91. {
  92.     static char name[4];
  93.  
  94.     name[0] = ((x[0] & 0x7C) >> 2) + '@';
  95.     name[1] = ((x[0] & 0x03) << 3) + ((x[1] & 0xE0) >> 5) + '@';
  96.     name[2] = (x[1] & 0x1F) + '@';
  97.     name[3] = 0;
  98.  
  99.     return name;
  100. }
  101.  
  102. bool set_mode(struct drm_device *dev, struct drm_connector *connector,
  103.               videomode_t *reqmode, bool strict)
  104. {
  105.     drm_i915_private_t      *dev_priv   = dev->dev_private;
  106.     struct drm_fb_helper    *fb_helper  = &dev_priv->fbdev->helper;
  107.  
  108.     struct drm_mode_config  *config     = &dev->mode_config;
  109.     struct drm_display_mode *mode       = NULL, *tmpmode;
  110.     struct drm_framebuffer  *fb         = NULL;
  111.     struct drm_crtc         *crtc;
  112.     struct drm_encoder      *encoder;
  113.     struct drm_mode_set     set;
  114.     char *con_name;
  115.     char *enc_name;
  116.     unsigned hdisplay, vdisplay;
  117.     int ret;
  118.  
  119.     mutex_lock(&dev->mode_config.mutex);
  120.  
  121.     list_for_each_entry(tmpmode, &connector->modes, head)
  122.     {
  123.         if( (drm_mode_width(tmpmode)    == reqmode->width)  &&
  124.             (drm_mode_height(tmpmode)   == reqmode->height) &&
  125.             (drm_mode_vrefresh(tmpmode) == reqmode->freq) )
  126.         {
  127.             mode = tmpmode;
  128.             goto do_set;
  129.         }
  130.     };
  131.  
  132.     if( (mode == NULL) && (strict == false) )
  133.     {
  134.         list_for_each_entry(tmpmode, &connector->modes, head)
  135.         {
  136.             if( (drm_mode_width(tmpmode)  == reqmode->width)  &&
  137.                 (drm_mode_height(tmpmode) == reqmode->height) )
  138.             {
  139.                 mode = tmpmode;
  140.                 goto do_set;
  141.             }
  142.         };
  143.     };
  144.  
  145.     DRM_ERROR("%s failed\n", __FUNCTION__);
  146.  
  147.     return -1;
  148.  
  149. do_set:
  150.  
  151.  
  152.     encoder = connector->encoder;
  153.     crtc = encoder->crtc;
  154.  
  155.     con_name = drm_get_connector_name(connector);
  156.     enc_name = drm_get_encoder_name(encoder);
  157.  
  158.     DRM_DEBUG_KMS("set mode %d %d: crtc %d connector %s encoder %s\n",
  159.               reqmode->width, reqmode->height, crtc->base.id,
  160.               con_name, enc_name);
  161.  
  162.     drm_mode_set_crtcinfo(mode, CRTC_INTERLACE_HALVE_V);
  163.  
  164.     hdisplay = mode->hdisplay;
  165.     vdisplay = mode->vdisplay;
  166.  
  167.     if (crtc->invert_dimensions)
  168.         swap(hdisplay, vdisplay);
  169.  
  170.     fb = fb_helper->fb;
  171.  
  172.     fb->width  = reqmode->width;
  173.     fb->height = reqmode->height;
  174.     fb->pitches[0]  = ALIGN(reqmode->width * 4, 64);
  175.     fb->pitches[1]  = ALIGN(reqmode->width * 4, 64);
  176.     fb->pitches[2]  = ALIGN(reqmode->width * 4, 64);
  177.     fb->pitches[3]  = ALIGN(reqmode->width * 4, 64);
  178.  
  179.     fb->bits_per_pixel = 32;
  180.     fb->depth = 24;
  181.  
  182.     crtc->fb = fb;
  183.     crtc->enabled = true;
  184.     os_display->crtc = crtc;
  185.  
  186.     set.crtc = crtc;
  187.     set.x = 0;
  188.     set.y = 0;
  189.     set.mode = mode;
  190.     set.connectors = &connector;
  191.     set.num_connectors = 1;
  192.     set.fb = fb;
  193.     ret = crtc->funcs->set_config(&set);
  194.     mutex_unlock(&dev->mode_config.mutex);
  195.  
  196.     if ( !ret )
  197.     {
  198.         os_display->width    = fb->width;
  199.         os_display->height   = fb->height;
  200.         os_display->pitch    = fb->pitches[0];
  201.         os_display->vrefresh = drm_mode_vrefresh(mode);
  202.  
  203.         sysSetScreen(fb->width, fb->height, fb->pitches[0]);
  204.  
  205.         DRM_DEBUG_KMS("new mode %d x %d pitch %d\n",
  206.                        fb->width, fb->height, fb->pitches[0]);
  207.     }
  208.     else
  209.         DRM_ERROR("failed to set mode %d_%d on crtc %p\n",
  210.                    fb->width, fb->height, crtc);
  211.  
  212.  
  213.     return ret;
  214. }
  215.  
  216. static int count_connector_modes(struct drm_connector* connector)
  217. {
  218.     struct drm_display_mode  *mode;
  219.     int count = 0;
  220.  
  221.     list_for_each_entry(mode, &connector->modes, head)
  222.     {
  223.         count++;
  224.     };
  225.     return count;
  226. };
  227.  
  228. static struct drm_connector* get_def_connector(struct drm_device *dev)
  229. {
  230.     struct drm_connector  *connector;
  231.     struct drm_connector_helper_funcs *connector_funcs;
  232.  
  233.     struct drm_connector  *def_connector = NULL;
  234.  
  235.     list_for_each_entry(connector, &dev->mode_config.connector_list, head)
  236.     {
  237.         struct drm_encoder  *encoder;
  238.         struct drm_crtc     *crtc;
  239.  
  240.         if( connector->status != connector_status_connected)
  241.             continue;
  242.  
  243.         connector_funcs = connector->helper_private;
  244.         encoder = connector_funcs->best_encoder(connector);
  245.         if( encoder == NULL)
  246.             continue;
  247.  
  248.         connector->encoder = encoder;
  249.  
  250.         crtc = encoder->crtc;
  251.  
  252.         DRM_DEBUG_KMS("CONNECTOR %x ID:  %d status %d encoder %x\n crtc %x",
  253.                    connector, connector->base.id,
  254.                    connector->status, connector->encoder,
  255.                    crtc);
  256.  
  257. //        if (crtc == NULL)
  258. //            continue;
  259.  
  260.         def_connector = connector;
  261.  
  262.         break;
  263.     };
  264.  
  265.     return def_connector;
  266. };
  267.  
  268.  
  269. int init_display_kms(struct drm_device *dev)
  270. {
  271.     struct drm_connector    *connector;
  272.     struct drm_connector_helper_funcs *connector_funcs;
  273.     struct drm_encoder      *encoder;
  274.     struct drm_crtc         *crtc = NULL;
  275.     struct drm_framebuffer  *fb;
  276.  
  277.     cursor_t  *cursor;
  278.     u32_t      ifl;
  279.     int        err;
  280.  
  281.     list_for_each_entry(connector, &dev->mode_config.connector_list, head)
  282.     {
  283.         if( connector->status != connector_status_connected)
  284.             continue;
  285.  
  286.         connector_funcs = connector->helper_private;
  287.         encoder = connector_funcs->best_encoder(connector);
  288.         if( encoder == NULL)
  289.         {
  290.             DRM_DEBUG_KMS("CONNECTOR %x ID: %d no active encoders\n",
  291.                       connector, connector->base.id);
  292.             continue;
  293.         }
  294.         connector->encoder = encoder;
  295.         crtc = encoder->crtc;
  296.  
  297.         DRM_DEBUG_KMS("CONNECTOR %x ID:%d status:%d ENCODER %x CRTC %x ID:%d\n",
  298.                connector, connector->base.id,
  299.                connector->status, connector->encoder,
  300.                crtc, crtc->base.id );
  301.  
  302.         break;
  303.     };
  304.  
  305.     if(connector == NULL)
  306.     {
  307.         DRM_ERROR("No active connectors!\n");
  308.         return -1;
  309.     };
  310.  
  311.     if(crtc == NULL)
  312.     {
  313.         struct drm_crtc *tmp_crtc;
  314.         int crtc_mask = 1;
  315.  
  316.         list_for_each_entry(tmp_crtc, &dev->mode_config.crtc_list, head)
  317.         {
  318.             if (encoder->possible_crtcs & crtc_mask)
  319.             {
  320.                 crtc = tmp_crtc;
  321.                 encoder->crtc = crtc;
  322.                 break;
  323.             };
  324.             crtc_mask <<= 1;
  325.         };
  326.     };
  327.  
  328.     if(crtc == NULL)
  329.     {
  330.         DRM_ERROR("No CRTC for encoder %d\n", encoder->base.id);
  331.         return -1;
  332.     };
  333.  
  334.  
  335.     DRM_DEBUG_KMS("[Select CRTC:%d]\n", crtc->base.id);
  336.  
  337.     os_display = GetDisplay();
  338.     os_display->ddev = dev;
  339.     os_display->connector = connector;
  340.     os_display->crtc = crtc;
  341.  
  342.     os_display->supported_modes = count_connector_modes(connector);
  343.  
  344.  
  345.     ifl = safe_cli();
  346.     {
  347.         struct intel_crtc *intel_crtc = to_intel_crtc(os_display->crtc);
  348.  
  349.         list_for_each_entry(cursor, &os_display->cursors, list)
  350.         {
  351.             init_cursor(cursor);
  352.         };
  353.  
  354.         os_display->restore_cursor(0,0);
  355.         os_display->init_cursor    = init_cursor;
  356.         os_display->select_cursor  = select_cursor_kms;
  357.         os_display->show_cursor    = NULL;
  358.         os_display->move_cursor    = move_cursor_kms;
  359.         os_display->restore_cursor = restore_cursor;
  360.         os_display->disable_mouse  = disable_mouse;
  361.  
  362.         intel_crtc->cursor_x = os_display->width/2;
  363.         intel_crtc->cursor_y = os_display->height/2;
  364.  
  365.         select_cursor_kms(os_display->cursor);
  366.     };
  367.     safe_sti(ifl);
  368.  
  369.     main_device = dev;
  370.  
  371. #ifdef __HWA__
  372.     err = init_bitmaps();
  373. #endif
  374.  
  375.     return 0;
  376. };
  377.  
  378.  
  379. int get_videomodes(videomode_t *mode, int *count)
  380. {
  381.     int err = -1;
  382.  
  383. //    dbgprintf("mode %x count %d\n", mode, *count);
  384.  
  385.     if( *count == 0 )
  386.     {
  387.         *count = os_display->supported_modes;
  388.         err = 0;
  389.     }
  390.     else if( mode != NULL )
  391.     {
  392.         struct drm_display_mode  *drmmode;
  393.         int i = 0;
  394.  
  395.         if( *count > os_display->supported_modes)
  396.             *count = os_display->supported_modes;
  397.  
  398.         list_for_each_entry(drmmode, &os_display->connector->modes, head)
  399.         {
  400.             if( i < *count)
  401.             {
  402.                 mode->width  = drm_mode_width(drmmode);
  403.                 mode->height = drm_mode_height(drmmode);
  404.                 mode->bpp    = 32;
  405.                 mode->freq   = drm_mode_vrefresh(drmmode);
  406.                 i++;
  407.                 mode++;
  408.             }
  409.             else break;
  410.         };
  411.         *count = i;
  412.         err = 0;
  413.     };
  414.     return err;
  415. };
  416.  
  417. int set_user_mode(videomode_t *mode)
  418. {
  419.     int err = -1;
  420.  
  421. //    dbgprintf("width %d height %d vrefresh %d\n",
  422. //               mode->width, mode->height, mode->freq);
  423.  
  424.     if( (mode->width  != 0)  &&
  425.         (mode->height != 0)  &&
  426.         (mode->freq   != 0 ) &&
  427.         ( (mode->width   != os_display->width)  ||
  428.           (mode->height  != os_display->height) ||
  429.           (mode->freq    != os_display->vrefresh) ) )
  430.     {
  431.         if( set_mode(os_display->ddev, os_display->connector, mode, true) )
  432.             err = 0;
  433.     };
  434.  
  435.     return err;
  436. };
  437.  
  438. void __attribute__((regparm(1))) destroy_cursor(cursor_t *cursor)
  439. {
  440.     list_del(&cursor->list);
  441.  
  442.     i915_gem_object_unpin(cursor->cobj);
  443.  
  444.     mutex_lock(&main_device->struct_mutex);
  445.     drm_gem_object_unreference(&cursor->cobj->base);
  446.     mutex_unlock(&main_device->struct_mutex);
  447.  
  448.     __DestroyObject(cursor);
  449. };
  450.  
  451. int init_cursor(cursor_t *cursor)
  452. {
  453.     struct drm_i915_private *dev_priv = os_display->ddev->dev_private;
  454.     struct drm_i915_gem_object *obj;
  455.     uint32_t *bits;
  456.     uint32_t *src;
  457.     void     *mapped;
  458.  
  459.     int       i,j;
  460.     int       ret;
  461.  
  462.     if (dev_priv->info->cursor_needs_physical)
  463.     {
  464.         bits = (uint32_t*)KernelAlloc(CURSOR_WIDTH*CURSOR_HEIGHT*4);
  465.         if (unlikely(bits == NULL))
  466.             return ENOMEM;
  467.         cursor->cobj = (struct drm_i915_gem_object *)GetPgAddr(bits);
  468.     }
  469.     else
  470.     {
  471.         obj = i915_gem_alloc_object(os_display->ddev, CURSOR_WIDTH*CURSOR_HEIGHT*4);
  472.         if (unlikely(obj == NULL))
  473.             return -ENOMEM;
  474.  
  475.         ret = i915_gem_object_pin(obj, CURSOR_WIDTH*CURSOR_HEIGHT*4, true, true);
  476.         if (ret) {
  477.             drm_gem_object_unreference(&obj->base);
  478.             return ret;
  479.         }
  480.  
  481. /* You don't need to worry about fragmentation issues.
  482.  * GTT space is continuous. I guarantee it.                           */
  483.  
  484.         mapped = bits = (u32*)MapIoMem(dev_priv->mm.gtt->gma_bus_addr + obj->gtt_offset,
  485.                     CURSOR_WIDTH*CURSOR_HEIGHT*4, PG_SW);
  486.  
  487.         if (unlikely(bits == NULL))
  488.         {
  489.             i915_gem_object_unpin(obj);
  490.             drm_gem_object_unreference(&obj->base);
  491.             return -ENOMEM;
  492.         };
  493.         cursor->cobj = obj;
  494.     };
  495.  
  496.     src = cursor->data;
  497.  
  498.     for(i = 0; i < 32; i++)
  499.     {
  500.         for(j = 0; j < 32; j++)
  501.             *bits++ = *src++;
  502.         for(j = 32; j < CURSOR_WIDTH; j++)
  503.             *bits++ = 0;
  504.     }
  505.     for(i = 0; i < CURSOR_WIDTH*(CURSOR_HEIGHT-32); i++)
  506.         *bits++ = 0;
  507.  
  508.     FreeKernelSpace(mapped);
  509.  
  510. // release old cursor
  511.  
  512.     KernelFree(cursor->data);
  513.  
  514.     cursor->data = bits;
  515.  
  516.     cursor->header.destroy = destroy_cursor;
  517.  
  518.     return 0;
  519. }
  520.  
  521.  
  522. static void i9xx_update_cursor(struct drm_crtc *crtc, u32 base)
  523. {
  524.     struct drm_device *dev = crtc->dev;
  525.     struct drm_i915_private *dev_priv = dev->dev_private;
  526.     struct intel_crtc *intel_crtc = to_intel_crtc(crtc);
  527.     int pipe = intel_crtc->pipe;
  528.     bool visible = base != 0;
  529.  
  530.     if (intel_crtc->cursor_visible != visible) {
  531.         uint32_t cntl = I915_READ(CURCNTR(pipe));
  532.         if (base) {
  533.             cntl &= ~(CURSOR_MODE | MCURSOR_PIPE_SELECT);
  534.             cntl |= CURSOR_MODE_64_ARGB_AX | MCURSOR_GAMMA_ENABLE;
  535.             cntl |= pipe << 28; /* Connect to correct pipe */
  536.         } else {
  537.             cntl &= ~(CURSOR_MODE | MCURSOR_GAMMA_ENABLE);
  538.             cntl |= CURSOR_MODE_DISABLE;
  539.         }
  540.         I915_WRITE(CURCNTR(pipe), cntl);
  541.  
  542.         intel_crtc->cursor_visible = visible;
  543.     }
  544.     /* and commit changes on next vblank */
  545.     I915_WRITE(CURBASE(pipe), base);
  546. }
  547.  
  548. void __stdcall move_cursor_kms(cursor_t *cursor, int x, int y)
  549. {
  550.     struct drm_i915_private *dev_priv = os_display->ddev->dev_private;
  551.     struct intel_crtc *intel_crtc = to_intel_crtc(os_display->crtc);
  552.     u32 base, pos;
  553.     bool visible;
  554.  
  555.     int pipe = intel_crtc->pipe;
  556.  
  557.     intel_crtc->cursor_x = x;
  558.     intel_crtc->cursor_y = y;
  559.  
  560.     x = x - cursor->hot_x;
  561.     y = y - cursor->hot_y;
  562.  
  563.  
  564.     pos = 0;
  565.  
  566.     base = intel_crtc->cursor_addr;
  567.     if (x >= os_display->width)
  568.         base = 0;
  569.  
  570.     if (y >= os_display->height)
  571.         base = 0;
  572.  
  573.     if (x < 0)
  574.     {
  575.         if (x + intel_crtc->cursor_width < 0)
  576.             base = 0;
  577.  
  578.         pos |= CURSOR_POS_SIGN << CURSOR_X_SHIFT;
  579.         x = -x;
  580.     }
  581.     pos |= x << CURSOR_X_SHIFT;
  582.  
  583.     if (y < 0)
  584.     {
  585.         if (y + intel_crtc->cursor_height < 0)
  586.             base = 0;
  587.  
  588.         pos |= CURSOR_POS_SIGN << CURSOR_Y_SHIFT;
  589.         y = -y;
  590.     }
  591.     pos |= y << CURSOR_Y_SHIFT;
  592.  
  593.     visible = base != 0;
  594.     if (!visible && !intel_crtc->cursor_visible)
  595.         return;
  596.  
  597.     I915_WRITE(CURPOS(pipe), pos);
  598. //    if (IS_845G(dev) || IS_I865G(dev))
  599. //        i845_update_cursor(crtc, base);
  600. //    else
  601.         i9xx_update_cursor(os_display->crtc, base);
  602.  
  603. };
  604.  
  605.  
  606. cursor_t* __stdcall select_cursor_kms(cursor_t *cursor)
  607. {
  608.     struct drm_i915_private *dev_priv = os_display->ddev->dev_private;
  609.     struct intel_crtc *intel_crtc = to_intel_crtc(os_display->crtc);
  610.     cursor_t *old;
  611.  
  612.     old = os_display->cursor;
  613.     os_display->cursor = cursor;
  614.  
  615.     if (!dev_priv->info->cursor_needs_physical)
  616.        intel_crtc->cursor_addr = cursor->cobj->gtt_offset;
  617.     else
  618.         intel_crtc->cursor_addr = (addr_t)cursor->cobj;
  619.  
  620.     intel_crtc->cursor_width = 32;
  621.     intel_crtc->cursor_height = 32;
  622.  
  623.     move_cursor_kms(cursor, intel_crtc->cursor_x, intel_crtc->cursor_y);
  624.     return old;
  625. };
  626.  
  627. struct sna_fb
  628. {
  629.     uint32_t  width;
  630.     uint32_t  height;
  631.     uint32_t  pitch;
  632.     uint32_t  tiling;
  633. };
  634.  
  635. int i915_fbinfo(struct sna_fb *fb)
  636. {
  637.     fb->width  = os_display->width;
  638.     fb->height = os_display->height;
  639.     fb->pitch  = os_display->pitch;
  640.     fb->tiling = 0;
  641.  
  642.     return 0;
  643. };
  644.  
  645.  
  646. #ifdef __HWA__
  647.  
  648. extern struct hmm bm_mm;
  649.  
  650.  
  651. typedef struct
  652. {
  653.     int left;
  654.     int top;
  655.     int right;
  656.     int bottom;
  657. }rect_t;
  658.  
  659.  
  660. #include "clip.inc"
  661.  
  662. void  FASTCALL GetWindowRect(rect_t *rc)__asm__("GetWindowRect");
  663.  
  664. #define CURRENT_TASK             (0x80003000)
  665.  
  666. static u32_t get_display_map()
  667. {
  668.     u32_t   addr;
  669.  
  670.     addr = (u32_t)os_display;
  671.     addr+= sizeof(display_t);            /*  shoot me  */
  672.     return *(u32_t*)addr;
  673. }
  674.  
  675. #define XY_COLOR_BLT                ((2<<29)|(0x50<<22)|(0x4))
  676. #define XY_SRC_COPY_BLT_CMD         ((2<<29)|(0x53<<22)|6)
  677. #define XY_SRC_COPY_CHROMA_CMD      ((2<<29)|(0x73<<22)|8)
  678. #define ROP_COPY_SRC                0xCC
  679. #define FORMAT8888                  3
  680.  
  681. #define BLT_WRITE_ALPHA             (1<<21)
  682. #define BLT_WRITE_RGB               (1<<20)
  683.  
  684.  
  685.  
  686. typedef int v4si __attribute__ ((vector_size (16)));
  687.  
  688.  
  689.  
  690. static void
  691. i915_gem_execbuffer_retire_commands(struct drm_device *dev,
  692.                     struct drm_file *file,
  693.                     struct intel_ring_buffer *ring)
  694. {
  695.     /* Unconditionally force add_request to emit a full flush. */
  696.     ring->gpu_caches_dirty = true;
  697.  
  698.     /* Add a breadcrumb for the completion of the batch buffer */
  699.     (void)i915_add_request(ring, file, NULL);
  700. }
  701.  
  702. int srv_blit_bitmap(u32 hbitmap, int  dst_x, int dst_y,
  703.                int src_x, int src_y, u32 w, u32 h)
  704. {
  705.     drm_i915_private_t *dev_priv = main_device->dev_private;
  706.     struct intel_ring_buffer *ring;
  707.     struct context *context;
  708.  
  709.     bitmap_t  *bitmap;
  710.     rect_t     winrc;
  711.     clip_t     dst_clip;
  712.     clip_t     src_clip;
  713.     u32_t      width;
  714.     u32_t      height;
  715.  
  716.     u32_t      br13, cmd, slot_mask, *b;
  717.     u32_t      offset;
  718.     u8         slot;
  719.     int        n=0;
  720.     int        ret;
  721.  
  722.     if(unlikely(hbitmap==0))
  723.         return -1;
  724.  
  725.     bitmap = (bitmap_t*)hmm_get_data(&bm_mm, hbitmap);
  726.  
  727.     if(unlikely(bitmap==NULL))
  728.         return -1;
  729.  
  730.     context = get_context(main_device);
  731.     if(unlikely(context == NULL))
  732.         return -1;
  733.  
  734.     GetWindowRect(&winrc);
  735.     {
  736.         static warn_count;
  737.  
  738.         if(warn_count < 1)
  739.         {
  740.             printf("left %d top %d right %d bottom %d\n",
  741.                     winrc.left, winrc.top, winrc.right, winrc.bottom);
  742.             printf("bitmap width %d height %d\n", w, h);
  743.             warn_count++;
  744.         };
  745.     };
  746.  
  747.  
  748.     dst_clip.xmin   = 0;
  749.     dst_clip.ymin   = 0;
  750.     dst_clip.xmax   = winrc.right-winrc.left;
  751.     dst_clip.ymax   = winrc.bottom -winrc.top;
  752.  
  753.     src_clip.xmin   = 0;
  754.     src_clip.ymin   = 0;
  755.     src_clip.xmax   = bitmap->width  - 1;
  756.     src_clip.ymax   = bitmap->height - 1;
  757.  
  758.     width  = w;
  759.     height = h;
  760.  
  761.     if( blit_clip(&dst_clip, &dst_x, &dst_y,
  762.                   &src_clip, &src_x, &src_y,
  763.                   &width, &height) )
  764.         return 0;
  765.  
  766.     dst_x+= winrc.left;
  767.     dst_y+= winrc.top;
  768.  
  769.     slot = *((u8*)CURRENT_TASK);
  770.  
  771.     slot_mask = (u32_t)slot<<24;
  772.  
  773.     {
  774. #if 0
  775.         static v4si write_mask = {0xFF000000, 0xFF000000,
  776.                                   0xFF000000, 0xFF000000};
  777.  
  778.         u8* src_offset;
  779.         u8* dst_offset;
  780.  
  781.         src_offset = (u8*)(src_y*bitmap->pitch + src_x*4);
  782.         src_offset += (u32)bitmap->uaddr;
  783.  
  784.         dst_offset = (u8*)(dst_y*os_display->width + dst_x);
  785.         dst_offset+= get_display_map();
  786.  
  787.         u32_t tmp_h = height;
  788.  
  789.         __asm__ __volatile__ (
  790.         "movdqa     %[write_mask],  %%xmm7    \n"
  791.         "movd       %[slot_mask],   %%xmm6    \n"
  792.         "punpckldq  %%xmm6, %%xmm6            \n"
  793.         "punpcklqdq %%xmm6, %%xmm6            \n"
  794.         :: [write_mask] "m" (write_mask),
  795.            [slot_mask]  "g" (slot_mask)
  796.         :"xmm7", "xmm6");
  797.  
  798.         while( tmp_h--)
  799.         {
  800.             u32_t tmp_w = width;
  801.  
  802.             u8* tmp_src = src_offset;
  803.             u8* tmp_dst = dst_offset;
  804.  
  805.             src_offset+= bitmap->pitch;
  806.             dst_offset+= os_display->width;
  807.  
  808.             while( tmp_w >= 8 )
  809.             {
  810.                 __asm__ __volatile__ (
  811.                 "movq       (%0),   %%xmm0            \n"
  812.                 "punpcklbw  %%xmm0, %%xmm0            \n"
  813.                 "movdqa     %%xmm0, %%xmm1            \n"
  814.                 "punpcklwd  %%xmm0, %%xmm0            \n"
  815.                 "punpckhwd  %%xmm1, %%xmm1            \n"
  816.                 "pcmpeqb    %%xmm6, %%xmm0            \n"
  817.                 "pcmpeqb    %%xmm6, %%xmm1            \n"
  818.                 "maskmovdqu %%xmm7, %%xmm0            \n"
  819.                 "addl       $16, %%edi                \n"
  820.                 "maskmovdqu %%xmm7, %%xmm1            \n"
  821.                 :: "r" (tmp_dst), "D" (tmp_src)
  822.                 :"xmm0", "xmm1");
  823.                 __asm__ __volatile__ ("":::"edi");
  824.                 tmp_w -= 8;
  825.                 tmp_src += 32;
  826.                 tmp_dst += 8;
  827.             };
  828.  
  829.             if( tmp_w >= 4 )
  830.             {
  831.                 __asm__ __volatile__ (
  832.                 "movd       (%0),   %%xmm0            \n"
  833.                 "punpcklbw  %%xmm0, %%xmm0            \n"
  834.                 "punpcklwd  %%xmm0, %%xmm0            \n"
  835.                 "pcmpeqb    %%xmm6, %%xmm0            \n"
  836.                 "maskmovdqu %%xmm7, %%xmm0            \n"
  837.                 :: "r" (tmp_dst), "D" (tmp_src)
  838.                 :"xmm0");
  839.                 tmp_w -= 4;
  840.                 tmp_src += 16;
  841.                 tmp_dst += 4;
  842.             };
  843.  
  844.             while( tmp_w--)
  845.             {
  846.                 *(tmp_src+3) = (*tmp_dst==slot)?0xFF:0x00;
  847.                 tmp_src+=4;
  848.                 tmp_dst++;
  849.             };
  850.         };
  851. #else
  852.         u8* src_offset;
  853.         u8* dst_offset;
  854.         u32 ifl;
  855.  
  856.         src_offset = (u8*)(src_y*bitmap->pitch + src_x*4);
  857.         src_offset += (u32)bitmap->uaddr;
  858.  
  859.         dst_offset = (u8*)(dst_y*os_display->width + dst_x);
  860.         dst_offset+= get_display_map();
  861.  
  862.         u32_t tmp_h = height;
  863.  
  864.       ifl = safe_cli();
  865.         while( tmp_h--)
  866.         {
  867.             u32_t tmp_w = width;
  868.  
  869.             u8* tmp_src = src_offset;
  870.             u8* tmp_dst = dst_offset;
  871.  
  872.             src_offset+= bitmap->pitch;
  873.             dst_offset+= os_display->width;
  874.  
  875.             while( tmp_w--)
  876.             {
  877.                 *(tmp_src+3) = (*tmp_dst==slot)?0xFF:0x00;
  878.                 tmp_src+=4;
  879.                 tmp_dst++;
  880.             };
  881.         };
  882.       safe_sti(ifl);
  883.     }
  884. #endif
  885.  
  886.     {
  887.         static warn_count;
  888.  
  889.         if(warn_count < 1)
  890.         {
  891.             printf("blit width %d height %d\n",
  892.                     width, height);
  893.             warn_count++;
  894.         };
  895.     };
  896.  
  897.  
  898.     if((context->cmd_buffer & 0xFC0)==0xFC0)
  899.         context->cmd_buffer&= 0xFFFFF000;
  900.  
  901.     b = (u32_t*)ALIGN(context->cmd_buffer,16);
  902.  
  903.     offset = context->cmd_offset + ((u32_t)b & 0xFFF);
  904.  
  905.     cmd = XY_SRC_COPY_CHROMA_CMD | BLT_WRITE_RGB | BLT_WRITE_ALPHA;
  906.     cmd |= 3 << 17;
  907.  
  908.     br13 = os_display->pitch;
  909.     br13|= ROP_COPY_SRC << 16;
  910.     br13|= FORMAT8888   << 24;
  911.  
  912.     b[n++] = cmd;
  913.     b[n++] = br13;
  914.     b[n++] = (dst_y << 16) | dst_x;                   // left, top
  915.     b[n++] = ((dst_y+height)<< 16)|(dst_x+width); // bottom, right
  916.     b[n++] = 0;                          // destination
  917.     b[n++] = (src_y << 16) | src_x;      // source left & top
  918.     b[n++] = bitmap->pitch;              // source pitch
  919.     b[n++] = bitmap->gaddr;              // source
  920.  
  921.     b[n++] = 0;                          // Transparency Color Low
  922.     b[n++] = 0x00FFFFFF;                 // Transparency Color High
  923.  
  924.     b[n++] = MI_BATCH_BUFFER_END;
  925.     if( n & 1)
  926.         b[n++] = MI_NOOP;
  927.  
  928.     context->cmd_buffer+= n*4;
  929.  
  930.     context->obj->base.pending_read_domains |= I915_GEM_DOMAIN_COMMAND;
  931.  
  932.  
  933.     mutex_lock(&main_device->struct_mutex);
  934.  
  935.     i915_gem_object_set_to_gtt_domain(bitmap->obj, false);
  936.  
  937.     if (HAS_BLT(main_device))
  938.     {
  939.         u32 seqno;
  940.         int i;
  941.  
  942.         ring = &dev_priv->ring[BCS];
  943. //        printf("dispatch...  ");
  944.  
  945.         i915_gem_object_sync(bitmap->obj, ring);
  946.         intel_ring_invalidate_all_caches(ring);
  947.  
  948.         seqno = i915_gem_next_request_seqno(ring);
  949. //        printf("seqno = %d\n", seqno);
  950.  
  951.         for (i = 0; i < ARRAY_SIZE(ring->sync_seqno); i++) {
  952.             if (seqno < ring->sync_seqno[i]) {
  953.             /* The GPU can not handle its semaphore value wrapping,
  954.              * so every billion or so execbuffers, we need to stall
  955.              * the GPU in order to reset the counters.
  956.              */
  957.                 DRM_DEBUG("wrap seqno\n");
  958.  
  959.                 ret = i915_gpu_idle(main_device);
  960.                 if (ret)
  961.                     goto fail;
  962.                 i915_gem_retire_requests(main_device);
  963.  
  964.                 BUG_ON(ring->sync_seqno[i]);
  965.             }
  966.         }
  967.  
  968.         ret = ring->dispatch_execbuffer(ring, offset, n*4);
  969.         if (ret)
  970.             goto fail;
  971. //        printf("done\n");
  972.  
  973.         bitmap->obj->base.read_domains = bitmap->obj->base.pending_read_domains;
  974.         bitmap->obj->base.write_domain = bitmap->obj->base.pending_write_domain;
  975.         bitmap->obj->fenced_gpu_access = bitmap->obj->pending_fenced_gpu_access;
  976.  
  977.         i915_gem_object_move_to_active(bitmap->obj, ring, seqno);
  978.  
  979.         i915_gem_execbuffer_retire_commands(main_device, NULL, ring);
  980. //        printf("retire\n");
  981.     }
  982.     else
  983.     {
  984.         ring = &dev_priv->ring[RCS];
  985.         ring->dispatch_execbuffer(ring, offset, n*4);
  986.         ring->flush(ring, 0, I915_GEM_DOMAIN_RENDER);
  987.     };
  988.  
  989. //    bitmap->obj->base.read_domains = I915_GEM_DOMAIN_CPU;
  990. //    bitmap->obj->base.write_domain = I915_GEM_DOMAIN_CPU;
  991.  
  992.     mutex_unlock(&main_device->struct_mutex);
  993. fail:
  994.     return ret;
  995. };
  996.  
  997.  
  998. #if 0
  999.  
  1000.     i915_gem_execbuffer_retire_commands(dev, ring);
  1001. /* For display hotplug interrupt */
  1002. static void
  1003. ironlake_enable_display_irq(drm_i915_private_t *dev_priv, u32 mask)
  1004. {
  1005.     if ((dev_priv->irq_mask & mask) != 0) {
  1006.         dev_priv->irq_mask &= ~mask;
  1007.         I915_WRITE(DEIMR, dev_priv->irq_mask);
  1008.         POSTING_READ(DEIMR);
  1009.     }
  1010. }
  1011.  
  1012. static int ironlake_enable_vblank(struct drm_device *dev, int pipe)
  1013. {
  1014.     drm_i915_private_t *dev_priv = (drm_i915_private_t *) dev->dev_private;
  1015.     unsigned long irqflags;
  1016.  
  1017. //    if (!i915_pipe_enabled(dev, pipe))
  1018. //        return -EINVAL;
  1019.  
  1020.     spin_lock_irqsave(&dev_priv->irq_lock, irqflags);
  1021.     ironlake_enable_display_irq(dev_priv, (pipe == 0) ?
  1022.                     DE_PIPEA_VBLANK : DE_PIPEB_VBLANK);
  1023.     spin_unlock_irqrestore(&dev_priv->irq_lock, irqflags);
  1024.  
  1025.     return 0;
  1026. }
  1027.  
  1028.  
  1029.  
  1030. static int i915_interrupt_info(struct drm_device *dev)
  1031. {
  1032.     drm_i915_private_t *dev_priv = dev->dev_private;
  1033.     int ret, i, pipe;
  1034.  
  1035.     if (!HAS_PCH_SPLIT(dev)) {
  1036.         dbgprintf("Interrupt enable:    %08x\n",
  1037.                I915_READ(IER));
  1038.         dbgprintf("Interrupt identity:  %08x\n",
  1039.                I915_READ(IIR));
  1040.         dbgprintf("Interrupt mask:      %08x\n",
  1041.                I915_READ(IMR));
  1042.         for_each_pipe(pipe)
  1043.             dbgprintf("Pipe %c stat:         %08x\n",
  1044.                    pipe_name(pipe),
  1045.                    I915_READ(PIPESTAT(pipe)));
  1046.     } else {
  1047.         dbgprintf("North Display Interrupt enable:      %08x\n",
  1048.            I915_READ(DEIER));
  1049.         dbgprintf("North Display Interrupt identity:    %08x\n",
  1050.            I915_READ(DEIIR));
  1051.         dbgprintf("North Display Interrupt mask:        %08x\n",
  1052.            I915_READ(DEIMR));
  1053.         dbgprintf("South Display Interrupt enable:      %08x\n",
  1054.            I915_READ(SDEIER));
  1055.         dbgprintf("South Display Interrupt identity:    %08x\n",
  1056.            I915_READ(SDEIIR));
  1057.         dbgprintf("South Display Interrupt mask:        %08x\n",
  1058.            I915_READ(SDEIMR));
  1059.         dbgprintf("Graphics Interrupt enable:           %08x\n",
  1060.            I915_READ(GTIER));
  1061.         dbgprintf("Graphics Interrupt identity:         %08x\n",
  1062.            I915_READ(GTIIR));
  1063.         dbgprintf("Graphics Interrupt mask:             %08x\n",
  1064.                I915_READ(GTIMR));
  1065.     }
  1066.     dbgprintf("Interrupts received: %d\n",
  1067.            atomic_read(&dev_priv->irq_received));
  1068.     for (i = 0; i < I915_NUM_RINGS; i++) {
  1069.         if (IS_GEN6(dev) || IS_GEN7(dev)) {
  1070.             printf("Graphics Interrupt mask (%s):       %08x\n",
  1071.                    dev_priv->ring[i].name,
  1072.                    I915_READ_IMR(&dev_priv->ring[i]));
  1073.         }
  1074. //        i915_ring_seqno_info(m, &dev_priv->ring[i]);
  1075.     }
  1076.  
  1077.     return 0;
  1078. }
  1079.  
  1080. void execute_buffer (struct drm_i915_gem_object *buffer, uint32_t offset,
  1081.                      int size)
  1082. {
  1083.     struct intel_ring_buffer *ring;
  1084.     drm_i915_private_t *dev_priv = main_device->dev_private;
  1085.     u32 invalidate;
  1086.     u32 seqno = 2;
  1087.  
  1088.     offset += buffer->gtt_offset;
  1089. //    dbgprintf("execute %x size %d\n", offset, size);
  1090.  
  1091. //    asm volatile(
  1092. //    "mfence \n"
  1093. //    "wbinvd \n"
  1094. //    "mfence  \n"
  1095. //    :::"memory");
  1096.  
  1097.     ring = &dev_priv->ring[RCS];
  1098.     ring->dispatch_execbuffer(ring, offset, size);
  1099.  
  1100.     invalidate = I915_GEM_DOMAIN_COMMAND;
  1101.     if (INTEL_INFO(main_device)->gen >= 4)
  1102.         invalidate |= I915_GEM_DOMAIN_SAMPLER;
  1103.     if (ring->flush(ring, invalidate, 0))
  1104.         i915_gem_next_request_seqno(ring);
  1105.  
  1106.     ring->irq_get(ring);
  1107.  
  1108.     ring->add_request(ring, &seqno);
  1109.  
  1110. //    i915_interrupt_info(main_device);
  1111.  
  1112. };
  1113.  
  1114.  
  1115. int blit_textured(u32 hbitmap, int  dst_x, int dst_y,
  1116.                int src_x, int src_y, u32 w, u32 h)
  1117. {
  1118.     drm_i915_private_t *dev_priv = main_device->dev_private;
  1119.  
  1120.     bitmap_t  *src_bitmap, *dst_bitmap;
  1121.     bitmap_t   screen;
  1122.  
  1123.     rect_t     winrc;
  1124.  
  1125. //    dbgprintf("  handle: %d dx %d dy %d sx %d sy %d w %d h %d\n",
  1126. //              hbitmap, dst_x, dst_y, src_x, src_y, w, h);
  1127.  
  1128.     if(unlikely(hbitmap==0))
  1129.         return -1;
  1130.  
  1131.     src_bitmap = (bitmap_t*)hman_get_data(&bm_man, hbitmap);
  1132. //    dbgprintf("bitmap %x\n", src_bitmap);
  1133.  
  1134.     if(unlikely(src_bitmap==NULL))
  1135.         return -1;
  1136.  
  1137.     GetWindowRect(&winrc);
  1138.  
  1139.     screen.pitch  = os_display->pitch;
  1140.     screen.gaddr  = 0;
  1141.     screen.width  = os_display->width;
  1142.     screen.height = os_display->height;
  1143.     screen.obj    = (void*)-1;
  1144.  
  1145.     dst_bitmap = &screen;
  1146.  
  1147.     dst_x+= winrc.left;
  1148.     dst_y+= winrc.top;
  1149.  
  1150.     sna_blit_copy(dst_bitmap, dst_x, dst_y, w, h, src_bitmap, src_x, src_y);
  1151.  
  1152. };
  1153.  
  1154. int sna_blit_tex(bitmap_t *dst_bitmap, int dst_x, int dst_y,
  1155.                   int w, int h, bitmap_t *src_bitmap, int src_x, int src_y,
  1156.                   bitmap_t *mask_bitmap);
  1157.  
  1158.  
  1159. int blit_tex(u32 hbitmap, int  dst_x, int dst_y,
  1160.              int src_x, int src_y, u32 w, u32 h)
  1161. {
  1162.     drm_i915_private_t *dev_priv = main_device->dev_private;
  1163.     struct context *ctx;
  1164.  
  1165.     bitmap_t  *src_bitmap, *dst_bitmap;
  1166.     bitmap_t   screen;
  1167.     int        ret;
  1168.  
  1169.     bitmap_t *mask_bitmap;
  1170.     rect_t     winrc;
  1171.  
  1172. //    dbgprintf("  handle: %d dx %d dy %d sx %d sy %d w %d h %d\n",
  1173. //              hbitmap, dst_x, dst_y, src_x, src_y, w, h);
  1174.  
  1175.     if(unlikely(hbitmap==0))
  1176.         return -1;
  1177.  
  1178.     src_bitmap = (bitmap_t*)hman_get_data(&bm_man, hbitmap);
  1179. //    dbgprintf("bitmap %x\n", src_bitmap);
  1180.  
  1181.     if(unlikely(src_bitmap==NULL))
  1182.         return -1;
  1183.  
  1184.     ctx = get_context();
  1185.     if(unlikely(ctx==NULL))
  1186.     {
  1187.         ret = create_context();
  1188.         if(ret!=0)
  1189.             return -1;
  1190.  
  1191.         ctx = get_context();
  1192.     };
  1193.  
  1194.     mask_bitmap = ctx->mask;
  1195.  
  1196.     GetWindowRect(&winrc);
  1197.     dst_x+= winrc.left;
  1198.     dst_y+= winrc.top;
  1199.  
  1200.  
  1201.     if(ctx->seqno != os_display->mask_seqno)
  1202.     {
  1203.         u8* src_offset;
  1204.         u8* dst_offset;
  1205.         u32 slot;
  1206.         u32 ifl;
  1207.  
  1208.         ret = gem_object_lock(mask_bitmap->obj);
  1209.         if(ret !=0 )
  1210.         {
  1211.             dbgprintf("%s fail\n", __FUNCTION__);
  1212.             return ret;
  1213.         };
  1214.  
  1215. //        printf("width %d height %d\n", winrc.right, winrc.bottom);
  1216.  
  1217.         mask_bitmap->width  = winrc.right;
  1218.         mask_bitmap->height = winrc.bottom;
  1219.         mask_bitmap->pitch =  ALIGN(w,64);
  1220.  
  1221.         slot = *((u8*)CURRENT_TASK);
  1222. //        slot = 0x01;
  1223.  
  1224.         slot|= (slot<<8)|(slot<<16)|(slot<<24);
  1225.  
  1226.  
  1227.         __asm__ __volatile__ (
  1228.         "movd       %[slot],   %%xmm6    \n"
  1229.         "punpckldq  %%xmm6, %%xmm6            \n"
  1230.         "punpcklqdq %%xmm6, %%xmm6            \n"
  1231.         :: [slot]  "m" (slot)
  1232.         :"xmm6");
  1233.  
  1234.         src_offset = mask_bitmap->uaddr;
  1235.  
  1236.         dst_offset = (u8*)(dst_y*os_display->width + dst_x);
  1237.         dst_offset+= get_display_map();
  1238.  
  1239.         u32_t tmp_h = mask_bitmap->height;
  1240.  
  1241.       ifl = safe_cli();
  1242.         while( tmp_h--)
  1243.         {
  1244.             int tmp_w = mask_bitmap->width;
  1245.  
  1246.             u8* tmp_src = src_offset;
  1247.             u8* tmp_dst = dst_offset;
  1248.  
  1249.             src_offset+= mask_bitmap->pitch;
  1250.             dst_offset+= os_display->width;
  1251.  
  1252. //            while( tmp_w--)
  1253. //            {
  1254. //                *(tmp_src) = (*tmp_dst==slot)?0x1:0x00;
  1255. //                tmp_src++;
  1256. //                tmp_dst++;
  1257. //            };
  1258.             while(tmp_w >= 64)
  1259.             {
  1260.                 __asm__ __volatile__ (
  1261.                 "movdqu     (%0),   %%xmm0            \n"
  1262.                 "movdqu   16(%0),   %%xmm1            \n"
  1263.                 "movdqu   32(%0),   %%xmm2            \n"
  1264.                 "movdqu   48(%0),   %%xmm3            \n"
  1265.                 "pcmpeqb    %%xmm6, %%xmm0            \n"
  1266.                 "pcmpeqb    %%xmm6, %%xmm1            \n"
  1267.                 "pcmpeqb    %%xmm6, %%xmm2            \n"
  1268.                 "pcmpeqb    %%xmm6, %%xmm3            \n"
  1269.                 "movdqa     %%xmm0,   (%%edi)         \n"
  1270.                 "movdqa     %%xmm1, 16(%%edi)         \n"
  1271.                 "movdqa     %%xmm2, 32(%%edi)         \n"
  1272.                 "movdqa     %%xmm3, 48(%%edi)         \n"
  1273.  
  1274.                 :: "r" (tmp_dst), "D" (tmp_src)
  1275.                 :"xmm0","xmm1","xmm2","xmm3");
  1276.                 tmp_w -= 64;
  1277.                 tmp_src += 64;
  1278.                 tmp_dst += 64;
  1279.             }
  1280.  
  1281.             if( tmp_w >= 32 )
  1282.             {
  1283.                 __asm__ __volatile__ (
  1284.                 "movdqu     (%0),   %%xmm0            \n"
  1285.                 "movdqu   16(%0),   %%xmm1            \n"
  1286.                 "pcmpeqb    %%xmm6, %%xmm0            \n"
  1287.                 "pcmpeqb    %%xmm6, %%xmm1            \n"
  1288.                 "movdqa     %%xmm0,   (%%edi)         \n"
  1289.                 "movdqa     %%xmm1, 16(%%edi)         \n"
  1290.  
  1291.                 :: "r" (tmp_dst), "D" (tmp_src)
  1292.                 :"xmm0","xmm1");
  1293.                 tmp_w -= 32;
  1294.                 tmp_src += 32;
  1295.                 tmp_dst += 32;
  1296.             }
  1297.  
  1298.             while( tmp_w > 0 )
  1299.             {
  1300.                 __asm__ __volatile__ (
  1301.                 "movdqu     (%0),   %%xmm0            \n"
  1302.                 "pcmpeqb    %%xmm6, %%xmm0            \n"
  1303.                 "movdqa     %%xmm0,   (%%edi)         \n"
  1304.                 :: "r" (tmp_dst), "D" (tmp_src)
  1305.                 :"xmm0");
  1306.                 tmp_w -= 16;
  1307.                 tmp_src += 16;
  1308.                 tmp_dst += 16;
  1309.             }
  1310.         };
  1311.       safe_sti(ifl);
  1312.       ctx->seqno = os_display->mask_seqno;
  1313.     }
  1314.  
  1315.     screen.pitch  = os_display->pitch;
  1316.     screen.gaddr  = 0;
  1317.     screen.width  = os_display->width;
  1318.     screen.height = os_display->height;
  1319.     screen.obj    = (void*)-1;
  1320.  
  1321.     dst_bitmap = &screen;
  1322.  
  1323.  
  1324.     sna_blit_tex(dst_bitmap, dst_x, dst_y, w, h, src_bitmap, src_x, src_y,
  1325.                  mask_bitmap);
  1326.  
  1327. //    asm volatile ("int3");
  1328. };
  1329.  
  1330.  
  1331. #endif
  1332.  
  1333.  
  1334. #endif
  1335.  
  1336.  
  1337.  
  1338.  
  1339.  
  1340. void __stdcall run_workqueue(struct workqueue_struct *cwq)
  1341. {
  1342.     unsigned long irqflags;
  1343.  
  1344. //    dbgprintf("wq: %x head %x, next %x\n",
  1345. //               cwq, &cwq->worklist, cwq->worklist.next);
  1346.  
  1347.     spin_lock_irqsave(&cwq->lock, irqflags);
  1348.  
  1349.     while (!list_empty(&cwq->worklist))
  1350.     {
  1351.         struct work_struct *work = list_entry(cwq->worklist.next,
  1352.                                         struct work_struct, entry);
  1353.         work_func_t f = work->func;
  1354.         list_del_init(cwq->worklist.next);
  1355. //        dbgprintf("head %x, next %x\n",
  1356. //                  &cwq->worklist, cwq->worklist.next);
  1357.  
  1358.         spin_unlock_irqrestore(&cwq->lock, irqflags);
  1359.         f(work);
  1360.         spin_lock_irqsave(&cwq->lock, irqflags);
  1361.     }
  1362.  
  1363.     spin_unlock_irqrestore(&cwq->lock, irqflags);
  1364. }
  1365.  
  1366.  
  1367. static inline
  1368. int __queue_work(struct workqueue_struct *wq,
  1369.                          struct work_struct *work)
  1370. {
  1371.     unsigned long flags;
  1372.  
  1373. //    dbgprintf("wq: %x, work: %x\n",
  1374. //               wq, work );
  1375.  
  1376.     if(!list_empty(&work->entry))
  1377.         return 0;
  1378.  
  1379.     spin_lock_irqsave(&wq->lock, flags);
  1380.  
  1381.     if(list_empty(&wq->worklist))
  1382.         TimerHs(0,0, run_workqueue, wq);
  1383.  
  1384.     list_add_tail(&work->entry, &wq->worklist);
  1385.  
  1386.     spin_unlock_irqrestore(&wq->lock, flags);
  1387. //    dbgprintf("wq: %x head %x, next %x\n",
  1388. //               wq, &wq->worklist, wq->worklist.next);
  1389.  
  1390.     return 1;
  1391. };
  1392.  
  1393. void __stdcall delayed_work_timer_fn(unsigned long __data)
  1394. {
  1395.     struct delayed_work *dwork = (struct delayed_work *)__data;
  1396.     struct workqueue_struct *wq = dwork->work.data;
  1397.  
  1398. //    dbgprintf("wq: %x, work: %x\n",
  1399. //               wq, &dwork->work );
  1400.  
  1401.     __queue_work(wq, &dwork->work);
  1402. }
  1403.  
  1404.  
  1405. int queue_delayed_work_on(struct workqueue_struct *wq,
  1406.                         struct delayed_work *dwork, unsigned long delay)
  1407. {
  1408.     struct work_struct *work = &dwork->work;
  1409.  
  1410.     work->data = wq;
  1411.     TimerHs(0,0, delayed_work_timer_fn, dwork);
  1412.     return 1;
  1413. }
  1414.  
  1415. int queue_delayed_work(struct workqueue_struct *wq,
  1416.                         struct delayed_work *dwork, unsigned long delay)
  1417. {
  1418.     u32  flags;
  1419.  
  1420. //    dbgprintf("wq: %x, work: %x\n",
  1421. //               wq, &dwork->work );
  1422.  
  1423.     if (delay == 0)
  1424.         return __queue_work(wq, &dwork->work);
  1425.  
  1426.     return queue_delayed_work_on(wq, dwork, delay);
  1427. }
  1428.  
  1429.  
  1430. struct workqueue_struct *alloc_workqueue(const char *fmt,
  1431.                            unsigned int flags,
  1432.                            int max_active)
  1433. {
  1434.     struct workqueue_struct *wq;
  1435.  
  1436.     wq = kzalloc(sizeof(*wq),0);
  1437.     if (!wq)
  1438.         goto err;
  1439.  
  1440.     INIT_LIST_HEAD(&wq->worklist);
  1441.  
  1442.     return wq;
  1443. err:
  1444.     return NULL;
  1445. }
  1446.  
  1447. #define NSEC_PER_SEC    1000000000L
  1448.  
  1449. void getrawmonotonic(struct timespec *ts)
  1450. {
  1451.     u32 tmp = GetTimerTicks();
  1452.  
  1453.     ts->tv_sec  = tmp/100;
  1454.     ts->tv_nsec = (tmp - ts->tv_sec*100)*10000000;
  1455. }
  1456.  
  1457. void set_normalized_timespec(struct timespec *ts, time_t sec, long nsec)
  1458. {
  1459.         while (nsec >= NSEC_PER_SEC) {
  1460.                 nsec -= NSEC_PER_SEC;
  1461.                 ++sec;
  1462.         }
  1463.         while (nsec < 0) {
  1464.                 nsec += NSEC_PER_SEC;
  1465.                 --sec;
  1466.         }
  1467.         ts->tv_sec = sec;
  1468.         ts->tv_nsec = nsec;
  1469. }
  1470.  
  1471.  
  1472.  
  1473.